Elon Musk annonce que sa start-up X.ai présentera prochainement la prochaine version de son intelligence artificielle générative. Il s'agit du logiciel Grok-1.5, le successeur du chatbot Grok-1.

Ce qui distingue généralement les modèles Grok des autres modèles d'IA générative, c'est qu'ils répondent à des questions sur des sujets qui ne sont généralement pas disponibles pour les autres modèles. Il en va de même pour le modèle Grok-5.1, qui repose sur un mécanisme de raisonnement amélioré, particulièrement visible lorsque le chatbot résout des problèmes mathématiques et s'occupe du codage. La société assure qu'après avoir exécuté le test mathématique MATH, le modèle Grok-5.1 a deux fois les performances du modèle Grok-1. À son tour, le test HumanEval (compétences en programmation) a montré que le modèle Grok-5.1 a obtenu des résultats supérieurs de plus de 10 points de pourcentage par rapport au modèle Grok-1.

Pour l’instant, il est difficile de prédire si ces résultats seront confirmés lorsque Grok-5.1 parviendra aux utilisateurs. Ces doutes proviennent du fait que les différents résultats obtenus après avoir effectué un test de référence en laboratoire ne sont pas confirmés dans le monde réel. Ce commentaire s'applique également aux benchmarks mesurant les performances des modèles de langage.

Une amélioration que les utilisateurs du nouveau modèle devraient facilement remarquer est la quantité de contexte. Le Grok-1.5 est clairement supérieur au modèle Grok-1. Ainsi, Grok-1.5 peut en traiter jusqu'à 128 000. jetons contenant des unités de texte. Il s'agit de fenêtres contextuelles. La fenêtre contextuelle fait référence aux données d'entrée (dans ce cas, le texte). Les modèles dotés de petites fenêtres contextuelles ont tendance à oublier le contenu des conversations récentes, tandis que les modèles dotés de fenêtres contextuelles plus grandes évitent cet écueil, avec l'avantage supplémentaire de mieux capturer le flux de données ingéré par le modèle.

Grok-1.5 peut donc utiliser des informations contenues dans des documents très longs. Il peut également prendre en charge des invites plus longues et plus complexes tout en conservant la possibilité d'exécuter des instructions à mesure que la fenêtre contextuelle s'agrandit.

Grok-1.5 sera bientôt disponible sur le site X.AI pour les premiers testeurs. L'annonce fait suite à la mise à disposition du code source du modèle Grok-1 aux utilisateurs, mais sans le code nécessaire au réglage ou à la formation continue. Musk a récemment déclaré que davantage d'utilisateurs de son service X – en particulier ceux payant pour le forfait Premium X à 8 $ par mois – auront accès au chatbot Grok, qui n'était auparavant disponible que pour les clients du forfait X Premium+ (qui paient 16 $ par mois). .

A lire également