L’entreprise souhaite ainsi accroître l’efficacité de ses centres de données prenant en charge les modèles d’IA générative, qui fournissent de tels services aux utilisateurs via ses plateformes cloud. Il s’agira, contrairement aux plateformes universelles de ce type proposées par Nvidia, de plateformes fournissant des services d’IA spécifiques et dédiés.
Amazon a annoncé la puce il y a un an lors de sa conférence annuelle des développeurs re:Invent, affirmant alors qu'elle la concevait pour prendre en charge de grands réseaux de neurones. Il a ensuite indiqué que son principal avantage serait de pouvoir prendre en charge le fonctionnement des réseaux de neurones en prenant en charge plus d'un milliard de paramètres. La société a l’intention de présenter officiellement prochainement son système de formation en IA appelé Trainium 2.
La puce Trainium 2 a été conçue par Annapurna Labs, qu'Amazon a acquis il y a neuf ans pour 350 millions de dollars. Le système est actuellement testé par le célèbre concepteur de modèles d’IA Anthropic. Amazon affirme que son système non seulement égale les performances des systèmes de ce type d'autres sociétés, mais qu'il est 40 % moins cher à exploiter.
