Il se passe beaucoup de choses sur le marché des puces IA ces derniers temps, mais la semaine dernière a été particulière à cet égard. Quatre fournisseurs leaders de tels systèmes ont récemment présenté des systèmes de ce type conçus par leurs propres équipes de recherche.
Il s'agit d'un événement important qui a poussé les analystes de ce marché à se demander comment leur principal rival, Nvidia, qui contrôle actuellement plus de 90 % de ce marché, réagirait à ces rapports. L'entreprise a récemment publié un rapport financier dans lequel on lit qu'au premier trimestre de cette année, ses bénéfices se sont élevés à 12,3 milliards de dollars. Que se passera-t-il si leurs plus grands rivaux commencent à concevoir et à produire leurs propres puces informatiques ? Et la semaine dernière, il y a eu quatre événements de ce type : les premières suivantes ont eu lieu cette semaine.
Bras a présenté le système Ethos-U85 NPU. Il s'agit de la troisième génération de systèmes de la ligne Ethos-U. Par rapport à son prédécesseur, le système offre des performances multipliées par 4 et une efficacité énergétique 20 % supérieure. Cela est particulièrement vrai pour les applications IoT, où nous constatons des exigences de performances encore plus élevées, notamment dans des domaines tels que l'automatisation des usines ou les caméras domestiques intelligentes. Il est conçu de telle manière qu'il est parfait pour prendre en charge le fonctionnement des systèmes basés sur les puces Cortex-M et Cortex-A, et tolère de longs délais DRAM.
Google a introduit le système Axion sur le marché. Il s'agit de la première puce ARM de Google et elle est conçue pour prendre en charge les centres de données. Axion est construit sur l'architecture et le jeu d'instructions Armv9 standard. et garantit que les systèmes d'exploitation et les suites logicielles populaires fonctionnent de manière transparente sur les serveurs et les machines virtuelles, permettant ainsi aux clients de déployer plus facilement des charges de travail ARM sur Google Cloud. Google fournit à ses clients cloud dotés de tels processeurs l'accès à un écosystème de dizaines de milliers de clients qui déploient des charges de travail et exploitent des logiciels fournis par des centaines d'ISV et de projets d'applications open source.
Intel a présenté un accélérateur d'IA appelé Gaudi 3, qui offre un débit 1,5 fois supérieur à celui de son prédécesseur, ainsi qu'une inférence 50 % meilleure et une efficacité énergétique moyenne 40 % supérieure par rapport au produit phare de ce type proposé par Nvidia ( nous parlons du système H100). Ce sera également un ordre de grandeur moins cher.
Méta a présenté son dernier accélérateur, MTIA v1 (Meta Training and Inference Accelerator), annoncé l'année dernière, garantissant qu'il est trois fois plus efficace que la première version. L'architecture de la puce vise fondamentalement à garantir le bon équilibre entre la puissance de traitement, la bande passante et la capacité de mémoire nécessaires pour prendre en charge les modèles de formation et de recommandation.
L'accélérateur se compose d'une grille 8×8 d'éléments de traitement (PE), qui offre une efficacité de calcul considérablement accrue. Meta a doublé la taille de la SRAM sur puce, augmenté sa bande passante de 3,5 fois et doublé la capacité de la mémoire LPDDR5.
Bien que les quatre sociétés aient déjà expérimenté des accélérateurs d’IA, leurs lancements la semaine dernière méritent une attention particulière. Ils prouvent que le groupe d’entreprises souhaitant jouer un rôle important sur le marché des puces ne cesse de croître et qu’il est actuellement difficile de prédire comment cette lutte se terminera. Une chose est sûre, les gagnants seront les entreprises mettant en œuvre des applications d’IA, qui peuvent compter sur leur travail de plus en plus rapide.