Outre les CPU et GPU, la dernière génération de datacenters comprend des DPU. Mais de quoi s’agit-il ? Pourquoi sont-ils vitaux pour la transformation digitale et la « quatrième révolution » ?
Par Kevin Deierling, VP Marketing chez NVIDIA réseaux
Le terme CPU (Central Processing Unit ou unité centrale de traitement) est utilisé depuis les années 1950. Le CPU est au cœur de tout ordinateur ou appareil intelligent, exécutant sans relâche les applications traditionnelles.
Depuis les années 1990, nous avons également le GPU (Graphical Processing Unit ou processeur graphique), créé à l’origine spécialement afin d’accélérer les images à l’écran pour les postes de travail d’ingénierie, le traitement vidéo et les jeux, dans une démarche visant à répondre aux attentes extrêmement fortes du système visuel humain.
Nous devons en effet notre survie à notre capacité à être instantanément alerté au plus petit mouvement ou à la plus petite anomalie visuelle, ce qui a toujours représenté un challenge difficile pour le cinéma, la télévision ou la conception des écrans d’ordinateur. Alors que le CPU est conçu pour traiter un flux de données linéaire, le GPU traite une expérience multidimensionnelle incluant trois dimensions spatiales plus des dimensions de couleur et de temps. En théorie, ce traitement pourrait être assuré par le CPU, mais, dans la pratique, ce serait beaucoup trop lent et imprécis.
Ce qui est passionnant à propos du GPU, c’est que cette capacité de traitement multidimensionnel s’avère être beaucoup plus proche des besoins de l’apprentissage automatique et du traitement de big data. Un composant créé à l’origine pour rendre les jeux d’ordinateur plus vivants est devenu un élément vital des datacenters au centre de la transformation digitale.
Et aujourd’hui on entend de plus en plus parler des DPU (Data Processing Units ou processeurs de données). Mais les CPU et les GPU ne traitent-ils pas déjà les données ? La différence n’est pas dans le traitement mais dans la façon de le faire. Le DPU joue un rôle essentiel dans la gestion de la manière dont les données traversent le data center. Et oui, il contient son propre CPU.
L’accélération par une gestion de réseau intelligente
Imaginez une conférence diplomatique internationale de haut niveau. Par souci de responsabilité pour une parfaite fidélité, il faudrait que les mots de chaque intervenant soient transcrits dans sa langue et transmis à tous les autres participants, charge à eux de les traduire ensuite dans leur propre langue. Mais en pratique, ce sont des interprètes qui traduisent à chacun dans sa langue ce qui a été dit. Les traducteurs ont le temps de consulter des dictionnaires, les interprètes font leur traduction à la volée.
Le rôle d’un interprète expérimenté et intelligent n’est pas simplement de fournir une traduction exacte, ce travail exige d’autres compétences. L’interprète doit d’abord comprendre les protocoles nationaux. Un interlocuteur australien pourra employer le mot « mate » (camarade) pour se montrer amical et l’interprète saura remplacer ce mot par « votre altesse » pour réduire la friction diplomatique. L’interprète doit également comprendre que certaines expressions d’une culture, par exemple « it isn’t cricket » (cela ne se fait pas) en anglais, peuvent avoir besoin d’une explication pour les autres. Et puis, il doit accélérer la communication en retirant les « euh », les pauses d’effet, et en raccourcissant les anecdotes personnelles digressives. Il peut même y avoir des codages subtils : « nos concurrents européens » peut être codé en « nos alliés européens ». Enfin, dans l’intérêt de la paix et de la sécurité du monde, certaines déclarations pourront être tout simplement omises.
Au lieu d’imposer à chaque délégué la tâche d’analyser des pages de transcription, une équipe de bons interprètes peut faire passer les messages essentiels sous la forme la plus économique, tout en filtrant toute malveillance éventuelle. Les délégués, n’ayant pas à se soucier de la traduction ni du protocole, peuvent mieux se concentrer sur la diplomatie de haut niveau.
Dans un datacenter traditionnel, le réseau n’est rien de plus qu’un enchevêtrement de câbles reliés par des commutateurs pour transporter les données vers et depuis les CPU, où s’effectue l’intégralité du traitement. Dans un datacenter moderne, le réseau est connecté via des DPU qui traitent les données à la volée pour réduire la charge des CPU et les libérer pour leur traitement applicatif. Ce rôle des DPU n’est pas sans analogie avec une équipe d’interprètes très professionnels. Alors qu’y a-t-il dans un DPU ?
Le DPU
Le DPU est une nouvelle classe de processeur programmable, un système sur puce (SOC – system on a chip) qui combine trois éléments :
- Un CPU multi-cœur standard haute performance programmable par logiciel.
- Une interface réseau haute performance capable d’analyser, de traiter et de transférer efficacement les données à la vitesse du réseau.
- Un ensemble riche de moteurs d’accélération souples et programmables conçus pour décharger des tâches réseau et optimiser les performances applicatives pour l’IA et l’apprentissage automatique, la sécurité, les télécommunications, le stockage, etc.
Ce troisième composant est particulièrement important car il est comparable aux compétences de l’interprète parfait évoqué plus haut : un ensemble de fonctions servant à optimiser l’efficacité, faisant en sorte que les bonnes données aillent dans le bon format au bon endroit via l’itinéraire le plus rapide et le plus fiable. Il peut également prendre en charge le chiffrement, ainsi qu’identifier le trafic anormal ou malveillant et même entreprendre une réponse appropriée. Certains fournisseurs de DPU peuvent s’appuyer sur des processeurs propriétaires, et d’autres compter sur le CPU pour faire tout le travail, mais si ces trois éléments ne sont pas présents, ce n’est pas vraiment un DPU.
Le DPU est généralement intégré à un contrôleur d’interface réseau (NIC) pour créer ce que l’on appelle un SmartNIC. Les SmartNIC sont des composants essentiels de la prochaine génération de datacenters, le type nécessaire pour permettre la révolution des données qui a été baptisée la « quatrième révolution ».
La quatrième révolution
Certains historiens distinguent trois révolutions majeures dans l’évolution de l’humanité :
- La révolution cognitive, vers 70 000 avant notre ère, a donné naissance au langage et à l’aptitude à communiquer.
- La révolution agricole, vers 10 000 avant notre ère, a produit notre capacité à domestiquer des animaux de ferme et à cultiver des récoltes pour nourrir les cités naissantes.
- La révolution scientifique, au début de la période moderne, a vu les développements en mathématiques, physique, astronomie et sciences poser les fondations de notre style de vie moderne.
La quatrième révolution est l’intelligence artificielle (IA), capable d’effectuer des tâches avec des niveaux de performance supérieurs à ceux de l’homme. L’apprentissage automatique avancé est maintenant capable d’organiser, de traiter et d’extraire des informations subtiles mais précieuses à partir de montagnes de données collectées auprès de millions d’utilisateurs sur Internet et sur l’Internet des Objets en pleine croissance. Cela marque une étape fondatrice vers le développement d’une vraie intelligence artificielle et les possibilités extraordinaires qu’elle offrira.
Même avec les GPU pour traiter les données, le progrès a été bloqué par la charge extrême pour les CPU de devoir accéder aux informations et les partager entre les ordinateurs tout en maintenant les GPU alimentés en données. Un développement important a été de rendre le réseau encore plus rapide, mais cela a submergé les CPU de tâches de gestion de données. Mais aujourd’hui avec les DPU, nous rendons le réseau plus intelligent, comme cette équipe d’interprètes hautement professionnels, de sorte qu’il devient un agent actif du traitement des données. Les DPU rapprochent le traitement des données elles-mêmes et font que le réseau se comporte comme un coprocesseur soulageant le moteur de calcul central.
La transformation digitale est l’application aux entreprises de la quatrième révolution. C’est pour cette raison que nous entendrons bientôt beaucoup plus parler des DPU.