Comment les entreprises peuvent-elles utiliser le NPU sur site pour traiter des données sensibles sans les envoyer vers le cloud ?

Pas aujourd’hui, mais NPU va révolutionner la façon dont nous utilisons les équipements professionnels. Comment profiter de ses bienfaits aujourd’hui ?

Le cycle de vie moyen des ordinateurs portables et des smartphones en entreprise est de 3 à 5 ans. Cela signifie que dans le pire des cas, dans quelques années, les employés disposeront d’équipements d’IA dès leur conception. En pratique, des outils de ce type font déjà leur apparition dans les organisations, et les mois à venir seront cruciaux. La fin du support du système d’exploitation Windows 10 entraînera d’importants investissements dans l’infrastructure informatique, déjà prête à fonctionner avec l’IA.

AI, ML, NPU, Copilot+ PC et AI by design sont les mots-clés les plus importants de la transformation informatique actuelle, qui révolutionnera considérablement notre façon de travailler.

NPU, c’est-à-dire processeur pour l’IA

L’unité de traitement neuronal (NPU) est un circuit intégré spécialisé conçu pour gérer les tâches liées au traitement des modèles d’intelligence artificielle, en particulier les réseaux de neurones. Contrairement aux CPU (processeurs à usage général) et aux GPU (spécialisés dans les graphiques), les NPU sont optimisés pour les tâches d’IA : classification d’images, reconnaissance vocale, analyse de données sensorielles et automatisation des décisions.

Les systèmes NPU sont le plus souvent intégrés directement sur la puce CPU et GPU, par ex. dans les processeurs Intel, AMD ou Qualcomm. On peut également les trouver dans les smartphones. La présence d’un NPU avec des performances supérieures à 45 TOPS permet de classer l’ordinateur comme compatible avec l’IA by design, c’est-à-dire capable de traiter des modèles de langage local et de simples chatbots directement sur l’appareil – même en mode hors ligne. La classification des performances peut varier – Apple considère tous les appareils basés sur des puces Apple Silicon comme des ordinateurs AI by Design.

Cybersécurité et protection de la vie privée : le boulet de l’IA

La plus grande préoccupation concernant la mise en œuvre de l’intelligence artificielle dans les entreprises concerne les problèmes liés au maintien d’un niveau approprié de confidentialité, ainsi qu’à la fourniture d’une cybersécurité complète de l’écosystème informatique. On parle beaucoup de l’utilisation des données transférées vers les LLM populaires à des fins d’apprentissage. De plus, travailler hors ligne signifie que les données dépassent l’infrastructure informatique de l’organisation, qui en perd le contrôle.

De nombreux entrepreneurs et responsables informatiques sont aujourd’hui confrontés au défi de traiter les données personnelles, financières, de santé ou opérationnelles d’une manière conforme au RGPD, à la HIPAA et à d’autres réglementations du secteur. Envoyer de telles données vers un cloud public (même sécurisé) comporte les risques de :
• Perte de contrôle sur les données
• Violation des règles de localisation des données (résidence des données)
• Possibilité de violer la vie privée des utilisateurs
• Augmentation des coûts de transfert et de stockage des données

Il existe deux solutions aux dilemmes mentionnés ci-dessus : créer votre propre solution d’IA au sein de l’organisation, sur vos propres serveurs, ou utiliser des appareils finaux qui permettent le traitement de l’IA directement sur eux.

La première option permet de construire tout un écosystème de services basés sur l’IA, mais elle prend du temps et est extrêmement coûteuse. Lancer votre propre modèle LLM, l’adapter aux besoins de l’organisation et le modifier constamment peut constituer un obstacle insurmontable pour de nombreuses entreprises.

D’autre part, les terminaux équipés de NPU permettent d’introduire l’intelligence artificielle directement sur l’appareil et de le séparer d’Internet.

Comment matérialiser le NPU dans l’organisation ?

Grâce au NPU et à la possibilité d’« enfermer » complètement l’intelligence artificielle dans l’appareil, les organisations peuvent désormais mettre en œuvre des solutions basées sur l’IA générative sans dépenses financières importantes.

Les NPU hautes performances que l’on trouve dans les ordinateurs portables peuvent même être utilisés pour exécuter localement des modèles SLM (petits modèles de langage). Ils ne sont pas aussi avancés que les grands LLM dans le cloud, mais ils permettent la synthèse, la comparaison, la traduction, l’analyse de données et la préparation de résumés de documents. Et tout cela de manière entièrement locale – uniquement sur la base des fichiers disponibles, donc également avec un risque minimal d’hallucinations.

Dans la situation actuelle du marché, les ordinateurs équipés de NPU utilisent aujourd’hui une puce supplémentaire principalement pour :

Optimisation de la consommation électrique
Augmenter les performances globales
Offrir une meilleure qualité vidéo et audio
Suppression dynamique du bruit de l’environnement ou recadrage de l’image
Analyser l’environnement et ajuster les paramètres de l’ordinateur, par ex. pour travailler avec des applications graphiques ou des vidéoconférences

L’étape suivante consiste à utiliser NPU pour des activités liées à l’intelligence artificielle générative, c’est-à-dire des chatbots propriétaires basés sur des modèles de langage open source installés localement, qui peuvent en outre être adaptés (affinés) aux besoins d’une organisation donnée.

L’avenir de l’IA n’existe pas sans le matériel NPU

De plus en plus de requêtes, un flux de données croissant et le nombre d’appareils connectés au réseau signifient que le système cloud, même malgré les intentions sincères des fournisseurs, peut avoir des problèmes avec la gestion de l’intelligence artificielle. La tendance actuelle est à l’informatique de pointe : déplacer toutes les tâches possibles d’IA et de ML vers la périphérie, c’est-à-dire vers les appareils finaux. Dans quelques années, la plupart des opérations d’IA seront effectuées uniquement localement et seules les requêtes les plus avancées et les plus complexes seront effectuées en coopération avec des modèles d’IA cloud.