Google MUM : Le nouvel Algorithme Google succède à Google BERT !
Temps de lecture estimé : 5 minutes
Qu’est ce que Google MUM ?
Lors du dernier événement Google I/O 2021, Google a annoncé la nouvelle version de son algorithme basé sur l’intelligence artificielle nommé MUM pour Multitask Unified Model ou Modèle Unifié Multitâches. MUM succédera donc à l’algorithme BERT lancé en 2019 dont nous parlions dans un précédent article de notre blog.
Selon Google, MUM serait 1000 fois plus puissant que BERT et peut fonctionner en mode multitâche. MUM s’appuie sur une architecture open source Transformer (rien à voir avec avec Bumblebee !). Pour les plus Geek d’entre nous, Transformer est un réseau de neurones récurrents (Cf. notre article sur l’intelligence artificielle et le Machine Learning) qui permet de comprendre le contexte des requêtes sans qu’il soit explicitement donné.
Selon Google, “Comme BERT, MUM est construit sur une architecture Transformer, mais il est 1 000 fois plus puissant et peut fonctionner en multitâche afin d’identifier une information de manière inédite. MUM ne se contente pas de comprendre le langage, il le génère également. Il est formé à 75 langues différentes et à de nombreuses tâches différentes à la fois, ce qui lui permet de développer une compréhension plus complète de l’information et de la connaissance du monde que les modèles précédents. Et MUM est multimodal, c’est-à-dire qu’il comprend l’information à travers le texte et les images et, à l’avenir, il pourra s’étendre à d’autres modalités comme la vidéo et l’audio. (…) Nous avons déjà lancé des pilotes internes avec MUM et nous sommes enthousiasmés par son potentiel d’amélioration des produits Google.” (Source Blog Google)
Google MUM est 1000 fois plus puissant que l’actuel algorithme Google Bert !
Partant du constat qu’il faut en moyenne huit requêtes pour répondre à certaines recherches, MUM permettra de répondre de manière pertinente aux requêtes complexes des internautes, comme celle donnée en exemple par Google “J’ai fait une randonnée sur le Mont Adams et je veux faire une randonnée sur le Mont Fuji l’automne prochain, que dois-je faire différemment pour me préparer ? ». Dans les requêtes complexes de ce type, il s’agit de combiner des entités, des sentiments et des intentions pour comprendre le sens de quelque chose. Les machines ont du mal à comprendre le langage humain, mais les modèles de langage comme BERT et MUM s’en rapprochent.
MUM va encore plus loin en traitant le langage et en y ajoutant la vidéo et les images, car il est multimodal, ce qui signifie selon Google “qu’il peut comprendre simultanément des informations provenant de différents formats, tels que des pages Web, des photos et autres. Un jour, vous pourrez prendre une photo de vos chaussures de randonnée et demander : “Puis-je les utiliser pour escalader le mont Fuji ? MUM comprendra l’image et l’associera à votre question pour vous dire que vos chaussures conviennent parfaitement. Il pourrait ensuite vous diriger vers un blog contenant une liste d’équipements recommandés”.
Google MUM comprend 75 langues et peut générer du contenu pour vous répondre
Il est ainsi possible de générer un résultat riche qui répond à la requête en présentant un tout nouveau contenu. MUM sera même intégré à Google Lens, de sorte que vous pourrez pointer votre appareil photo sur vos chaussures de randonnée et demander si elles sont adaptées à cette randonnée vers le mont Fuji !
MUM est capable de comprendre 75 langues, de comprendre des informations présentes dans textes mais donc aussi bientôt aussi dans les images, l’audio ou les vidéos ! MUM sera également capable de produire du contenu pour restituer ces résultats.
L’algorithme Google MUM est toujours en phase de test et sera déployé progressivement dans les mois et années à venir.
Google bascule progressivement vers un moteur de recherche entièrement basé sur l’IA (Intelligence Artificielle). D’ailleurs pouvons-nous encore parler de “Moteur de recherche” ou s’agit-il d’une “machine de présentation des connaissances” ?
LaMDA : une nouvelle technologue qui permet de communiquer avec une intelligence artificielle
LaMDA, ou modèle de langage pour les applications de dialogue, est un autre élément important de la présentation de Google lors de sa conférence I/O 2021. Il s’agit d’une nouvelle technologie permettant de communiquer avec une IA – comme un chatbot par exemple – de manière beaucoup plus naturelle. Elle peut converser d’une manière plus fluide que les IA précédentes. Les chatbots s’embrouillent facilement lorsque vous changez de sujets dans la conversation ou lorsque le contexte est ambigu. À quand le test de Turing ?
Intelligence artificielle (IA) et éthique
Ces évolutions de l’intelligence artificielle de Google posent également de questions éthiques. Par exemple, si Google peut réellement lire, entendre et voir du contenu dans toutes les langues et le reconditionner dans un nouveau format – avec le contexte et le contenu généré par l’IA – qui en est le propriétaire ?
Et qui est responsable du contenu de ces résultats automatisés ? Et qu’en est-il de la partialité de l’IA ? Les préjugés et l’éthique sont des sujets très importants en matière d’IA, et si nous voulons vraiment progresser vers un avenir alimenté par l’IA, nous devons être assurés de sa neutralité et de sa fiabilité. Bien sûr, Google mentionne spécifiquement la partialité de l’IA dans son message et continue à former le modèle. Bonne nouvelle mais est-ce suffisant ?