Ordinateurs de bureau
Des solutions d'affaires
Ordinateurs portables
Informatique, téléphonie
Téléphonie
Trucs et astuces
11.07.2024 08:05

Partager avec d'autres :

Partager

Qu'est-ce qu'une puce NPU ?

Si vous avez suivi les évolutions dans le domaine de l’informatique ces derniers mois, vous êtes peut-être de plus en plus souvent confronté au terme NPU, notamment dans les tâches où l’intelligence artificielle est présente.
Qu'est-ce qu'une puce NPU ?

Au fait, qu’est-ce que le NPU ? Quelle est sa fonction ? En avons-nous vraiment besoin ? Pour beaucoup, il suffit de savoir quel processeur et quelle carte graphique se trouvent dans un ordinateur, une tablette ou un téléphone. Même ceux d'entre nous qui testent ce type d'appareils n'ont pas prêté beaucoup d'attention aux puces NPU jusqu'à présent. Mais les temps changent. Le NPU est ou deviendra aussi important que le processeur (CPU) et la carte graphique (GPU).

Qu’est-ce que le NPU ?

Le NPU est un processeur dédié pour accélérer les tâches d'apprentissage automatique et d'intelligence artificielle
Le NPU est un processeur dédié pour accélérer les tâches d'apprentissage automatique et d'intelligence artificielle

Une NPU, ou unité de traitement neuronal, est un processeur ou une unité de traitement dédié dans un système sur puce (SoC) plus grand, spécialement conçu pour accélérer les performances des réseaux neuronaux et des tâches d'intelligence artificielle. Contrairement aux processeurs et aux GPU à usage général, les NPU sont optimisés pour le calcul parallèle basé sur les données. Ils sont donc très efficaces pour traiter des données multimédias à grande échelle telles que des vidéos et des images, ainsi que pour traiter des données destinées aux réseaux neuronaux. Ils sont particulièrement doués pour les tâches liées à l'IA telles que la reconnaissance vocale, le flou d'arrière-plan lors des appels vidéo et les procédures de retouche photo ou vidéo telles que la détection d'objets, l'effacement, l'ajout d'éléments, etc.

Les NPU sont des circuits intégrés, mais ils diffèrent considérablement des ASIC (Application-Specific Integrated Circuits) à fonction unique. Alors que les ASIC sont conçus dans un seul but, comme l’extraction d’une cryptomonnaie spécifique, les puces NPU offrent une plus grande complexité et flexibilité, répondant aux diverses exigences de l’informatique en réseau. Ils y parviennent grâce à une programmation spécialisée dans des logiciels ou du matériel adaptée aux exigences uniques des calculs de réseaux neuronaux.

Dans la plupart des produits grand public, le NPU sera en fait intégré au processeur principal, comme dans les séries Intel Core et Core Ultra ou les nouveaux processeurs pour ordinateurs portables AMD Ryzen 8040. Cependant, dans les centres de données plus grands ou dans les opérations industrielles plus spécialisées, le NPU peut être intégré au processeur principal. un processeur entièrement séparé sur la carte mère, distinct de toutes les autres unités de traitement. Sur les téléphones, les puces NPU sont généralement intégrées sur un système sur puce, où l'on retrouve également les cœurs de processeur et graphiques.

Chaque fabricant nomme ses puces NPU légèrement différemment. Apple les appelle Neural Engine, Qualcomm a choisi Hexagon, Google, par exemple, Tensor Processing Unit (TPU) et Huawei Da Vinci Architecture. Fait intéressant, Huawei a été parmi les premiers à intégrer le NPU dans le smartphone Mate 10.

Pourquoi les téléphones et les ordinateurs ont-ils même besoin de NPU ?

Lorsque Samsung a dévoilé son concept Galaxy AI plus tôt cette année, c'était peut-être la première fois qu'on parlait de la puce NPU. Pourquoi? Si vous avez réussi à tester leurs fonctionnalités d’IA, vous avez peut-être remarqué que certaines fonctionnent localement et d’autres nécessitent une connexion à un serveur distant. Si nous voulons que les fonctions s'exécutent localement, c'est-à-dire directement sur notre appareil, nous avons besoin d'un NPU, surtout si nous voulons que les tâches s'exécutent parfaitement.

Une grande partie du traitement actuel de l’IA est effectuée dans le cloud, mais ce n’est pas idéal pour plusieurs raisons. Le premier concerne la latence et les exigences du réseau. Il se peut que vous ne puissiez pas accéder aux outils lorsque vous êtes hors ligne ou que vous deviez attendre de longs délais de traitement lors des pics de trafic. L'envoi de données sur Internet est également moins sécurisé, ce qui est un facteur très important lors de l'utilisation d'une intelligence artificielle qui a accès à vos données personnelles, comme le désormais tristement célèbre Recall de Microsoft.

Dans la mesure du possible, une opération locale est préférable. Cependant, les fonctions d’IA ne sont pas une sinécure, elles nécessitent un peu de puissance. Si vous êtes l'un des rares à avoir installé Stable Diffusion sur votre PC au début de l'engouement pour l'IA, alors vous savez de quel type de matériel vous avez besoin pour obtenir des résultats relativement solides. Personne ne veut attendre trop longtemps, et même si le processeur et la carte graphique pourraient faire beaucoup de choses à eux seuls, cela ne suffira plus à partir de maintenant.

La solution réside dans les puces NPU, qui peuvent accélérer considérablement ces tâches. Leurs performances sont souvent exprimées en milliards d'opérations par seconde (TOPS), mais ce n'est pas une mesure très utile car elle ne vous indique pas exactement ce que fait chaque opération. Au lieu de cela, il est souvent préférable de rechercher des données qui indiquent la vitesse à laquelle les jetons pour les grands modèles de langage doivent être traités, la quantité d'énergie qu'ils utilisent, leur précision, la quantité de données qu'ils peuvent lire ou écrire, etc.

NPU et GPU. Quelle est la différence?

Bien que de nombreuses charges de travail d’IA et d’apprentissage automatique s’exécutent sur des GPU, il existe une différence importante entre un GPU et un NPU.

Bien que les GPU soient connus pour leurs capacités de calcul parallèle, tous les GPU ne sont pas tout à fait capables de gérer de nombreuses autres tâches en plus des graphiques, car ils nécessitent des circuits intégrés spéciaux pour gérer efficacement les charges de travail d'apprentissage automatique. Les GPU Nvidia les plus populaires disposent de ces circuits sous la forme de cœurs Tensor, mais AMD et Intel les ont également intégrés à leurs GPU, principalement pour gérer les opérations haut de gamme, l'une des tâches d'IA les plus courantes.

Avec les puces NPU, nous pouvons simplement séparer ces circuits du GPU, le laisser accomplir sa tâche principale de toutes ses forces et intégrer les circuits séparés dans une unité dédiée indépendante. Cela permet de traiter plus efficacement les tâches liées à l'IA avec moins de consommation d'énergie, ce qui explique également pourquoi elles deviennent un composant indispensable dans les ordinateurs portables et les téléphones. Pour les tâches les plus exigeantes, ils auront toujours besoin d’au moins l’aide d’un processeur graphique.

NPU et CPU. Que fait l'un, que fait l'autre ?

Une NPU diffère d’une unité centrale de traitement (CPU) par la charge de travail pour laquelle elle est conçue. Un processeur typique d'un ordinateur ou d'un téléphone a des tâches très générales, et cela lui convient, car il prend en charge un large éventail de commandes, différentes manières de mettre en cache et d'appeler des fonctions.

Comme nous l’avons déjà dit, les tâches d’apprentissage automatique et d’intelligence artificielle sont différentes et ne nécessitent pas autant de flexibilité. Non seulement ils sont plus exigeants, mais ils fonctionnent souvent sur des formats inhabituels, tels que des nombres 16, 8 ou 4 bits. Bien que les processeurs puissent effectuer des tâches d’apprentissage automatique de base, ce n’est pas leur tâche principale et ils y sont beaucoup plus lents.

La NPU à l'avenir composant requis ?

Presque certainement, à moins que vous ne siffliez contre l’IA.

Par exemple, si vous souhaitez utiliser Microsoft Copilot Plus, vous aurez besoin d'une puce NPU d'une capacité minimale de 40 TOPS. Par exemple, vous pourrez utiliser les fonctions IA locales Recall, Cocreator et Live Captions.

Au moins pour l’instant, peu d’applications nécessitent une puce NPU dans le cadre de leurs conditions d’utilisation. Cela changera probablement à mesure que les développeurs chercheront à intégrer davantage de fonctionnalités natives, telles qu'Adobe, DaVinci Resolve ou peut-être Teams et Zoom.

Il faudra également faire attention à ce composant dans le cas des téléphones. Avec les téléphones premium, vous pouvez être sûr d’avoir accès à la meilleure puce NPU et à toutes les fonctionnalités d’IA que le fabricant a à offrir. Dans les classes populaires, par exemple pour 500 euros et moins, cela ne va pas de soi. Si vous souhaitez jouer avec l'intelligence artificielle, vous devrez probablement vous tourner vers la classe à partir de 1000 euros.

Cependant, pour le moment, vous n’êtes pas pressé d’acheter un nouvel ordinateur ou un nouvel téléphone. Nous n'en sommes qu'au début, et au moins pour l'instant, vous n'avez pas manqué grand-chose.


Vous souhaitez en savoir plus sur ce sujet ?
Pomme Microsoft intelligence artificielle


Que lisent les autres ?