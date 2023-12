La course à l’intelligence artificielle (IA) continue, et c’est désormais au tour de Google d’abattre une de ses cartes. Le géant vient de proposer Gemini, un modèle d’IA générative multimodal. Concurrent direct de ChatGPT d’OpenAI, il compte bien se faire une place dans un paysage désormais bien rempli. Zoom sur ce nouveau venu.

Gemini, l’IA de Google aux grandes ambitions

Gemini est proposé sous trois version : Gemini Ultra, Gemini Pro et Gemini Nano. Chacune d’entre elle s’adapte aux tâches demandées, ainsi qu’aux appareils utilisés – Nano est ainsi destiné aux appareils mobiles. Gemini Ultra est la version la plus puissante, qui est destinée aux tâches très complexes.

Le modèle est capable de consulter différents types d’informations (textes, images, vidéos), afin d’en retirer des données. Selon le scientifique en chef de Google, Jeff Dean, Gemini est même capable de dépasser les performances humaines en ce qui concerne la compréhension de la langue (massive multitask language understanding).

À l’inverse de ChatGPT, Gemini a été conçue dès le départ pour être multimodale. À l’inverse, l’IA d’OpenAI est parti d’un modèle textuel avant d’étendre ses capacités. Par ailleurs, Gemini peut aller chercher de l’information sur le Web, à l’inverse de la version gratuite de ChatGPT, dont les données s’arrêtent à une certaine date.

L’IA la plus puissante du moment ?

Selon Google, Gemini dépasse les capacités de ChatGPT 4V sur 6 des 8 points de références qui permettent d’évaluer les capacités d’une IA. Cela en ferait donc le modèle le plus puissant du moment. Gemini est capable de générer du texte, des images, des lignes de code ou des vidéos.

Comparaison entre Gemini et GPT-4V sur huit points de référence

Gemini a été intégrée à Bard, le modèle d’IA générative textuelle de Google. Il est donc déjà possible de tester ses capacités. Gemini Nano sera par ailleurs intégrée de manière native au Pixel 8 Pro, le smartphone phare de Google à l’heure actuelle.

Par ailleurs, Gemini sera aussi utilisé sur d’autres services proposés par Google, dont la recherche, la publicité, ainsi que le navigateur Google Chrome. Ces changements auront lieu dans les prochains mois selon le communiqué. Gemini Ultra, la version la plus puissante du modèle, est en cours de vérification. Elle sera proposée à un nombre limité de clients et développeurs en début d’année prochaine.

Google communique en effet sur la « responsabilité » et le besoin de faire évoluer les modèles d’AI de manière raisonnée. Elle se place ainsi en contrepoint d’OpenAI, dont un modèle avait suscité la crainte ces dernières semaines. Tout cela montre en tout car que la course à l’AI est lancée, et que Google croit fermement en l’avenir de ces technologies.

Source : Google

