Principales fonctionnalités de Gemini 2.0 Flash
Gémeaux 2.0 Flash utilise toutes les capacités de la version 1.5 Flash. Le modèle Flash 2.0 obtient des résultats supérieurs au 1.5 Pro dans les tests clés et fonctionne deux fois plus vite et possède de nouvelles fonctions. En plus des entrées multimodales telles que des images, des vidéos et des sons, Flash 2.0 prend désormais également en charge les sorties multimodales : Images générées nativement combinées avec du texte et Son TTS contrôlable dans de nombreuses langues. Il peut également invoquer nativement des outils tels que la recherche Google, exécuter du code et exécuter des fonctions externes spécifiées par l'utilisateur.
Gemini 2.0 Flash est disponible pour les développeurs via l'API Gemini. Il a déjà été implémenté dans l'application client. Gémeaux pour les utilisateurs finaux, un début 2025, il apparaîtra dans d'autres services écosystémiques de Google.
Agents IA dédiés dans Gemini 2.0 Flash
Parallèlement à Gemini 2.0 Flash, Google a également présenté agents d'IA expérimentaux. Ça a l'air intéressant Projet Marin. C'est un début prototype de recherche construit en utilisant Gemini 2.0 qui explore l'avenir de l'interaction homme-agent, en commençant par le navigateur. En tant que prototype de recherche, il est capable de comprendre et d'analyser les informations sur l'écran d'un navigateur, y compris les pixels et les éléments Web tels que le texte, le code, les images et les formulaires, puis d'utiliser ces informations via une extension Chrome expérimentale pour effectuer des tâches pour l'utilisateur.
