Avec l’arrivée des GPU d’IA de dernière génération, la puissance consommée par serveur ainsi que la chaleur associée augmentent rapidement, ce qui impose une révision complète des enveloppes électriques et thermiques des datacenters traditionnels.
L’intégration de nombreuses unités GPU puissantes dans les racks pousse les densités électriques bien au-delà des 5–10 kW par rack historiques. Les systèmes actuels basés sur des GPU haut de gamme (comme Blackwell Ultra) peuvent nécessiter jusqu’à 120–140 kW par rack, soit une multiplication par 3 à 6 de la puissance par rack par rapport aux architectures précédentes (par exemple A100/H100) et jusqu’à 10× celle des racks CPU classiques. Bientôt, des racks d’IA pourront atteindre 600 kW selon les architectures d’équipement comme la gamme Rubin Ultra NVL576 de Nvidia.
En offrant des performances supérieures (jusqu’à x1,5 en inférence FP4 et plus de mémoire) par rapport aux générations précédentes, le Blackwell Ultra anticipe une migration vers des racks extrêmement denses.
Augmentation de la charge par rack
La multiplication de la puissance par rack a des conséquences lourdes :
- Redimensionnement des alimentations électriques : les UPS, transformateurs et alimentations de site doivent être dimensionnés pour supporter jusqu’à 150 kW par rack en pointe sans dégradation de la qualité de service.
- Gestion du courant de démarrage et déséquilibres : la distribution électrique doit maîtriser le courant d’appel et l’équilibrage phases, sous peine d’induire des déclenchements ou des surcharges.
- Infrastructure de distribution redondante : N+1 ou 2N souvent requis pour maintenir l’uptime dans un contexte de charges très variables associées aux tournées de workloads IA.
Pour accueillir ces densités, les data centers adoptent des busways haute capacité plutôt que des câbles traditionnels, facilitant l’ajout progressif de puissance ; des PDU (Power Distribution Units) intelligents avec mesure granulaire, pilotant l’alimentation jusqu’au niveau des racks pour éviter les surcharges ; et le profilage de charge dynamique via des logiciels capables de prédire et répartir l’énergie selon les besoins des clusters GPU.
Et une distribution haute tension (HVDC) autour de 600–800 V DC pour minimiser les pertes résistives, réduire les conversions AC/DC et supporter des flux de puissance très élevés sans infrastructures massives en cuivre.
Évolution de l’enveloppe électrique
La transition vers des alimentations DC haute tension jusqu’au niveau des racks est appelée à devenir un standard pour les installations d’IA à très haute densité, réduisant à la fois l’encombrement matériel et les pertes énergétiques. Avec des architectures de conversion innovantes intégrant des semi-conducteurs à large bande (GaN, SiC) pour augmenter l’efficacité des alimentations.
L’augmentation de puissance met également sous tension UPS et systèmes de secours dimensionnés pour des charges continues significatives.Busways intelligents avec surveillance de charge dynamique et protections avancées pour éviter les surcharges et maintenir l’uptime. Et standardisation modulaire facilitant ajout et remplacement d’unités de puissance sans interruption majeure.
Évolution de l’Enveloppe Thermique
À mesure que la puissance par rack augmente, la charge thermique dissipée suit la même trajectoire — ce qui dépasse largement les capacités des systèmes d’air conditionné basés sur l’air seul. Selon les estimations du secteur, là où des racks traditionnels pouvaient dissiper correctement jusqu’à 20 kW, les nouveaux racks IA exigent des systèmes capables de gérer des centaines de kilowatts de chaleur.
Les nouveaux GPU génèrent une densité thermique élevée en raison de leur puissance de calcul. La dissipation de cette énergie devient un facteur limitant de la performance et de la fiabilité. Les principales contraintes sont des points chauds localisés sur les serveurs et au sein des racks, et un échauffement élevé des composants VRM/CPU/GPU, nécessitant des points de refroidissement plus efficaces.
Pour répondre à ces exigences, plusieurs technologies de refroidissement émergent ou se répandent :
- Refroidissement liquide direct (DTC – Direct to Chip) : circulation de liquide caloporteur directement sur les surfaces chaudes pour extraire efficacement la chaleur.
- Refroidissement par immersion : submersion directe des composants dans un fluide diélectrique à haute conductivité thermique, idéal pour des densités extrêmes.
- Échangeurs thermiques à porte arrière (Rear Door Heat Exchangers) : capturent la chaleur du flux d’air sortant des racks pour réduire la charge sur le système HVAC du datacenter.
Ces approches, souvent combinées dans des architectures hybrides (liquide + air), permettent non seulement de gérer les points chauds efficacement mais aussi de réduire la consommation énergétique globale en diminuant le recours à des systèmes de climatisation puissants.
Des innovations récentes — comme les canaux microfluidiques intégrés directement dans le silicium des puces — promettent de réduire significativement les températures de pic tout en améliorant l’efficacité thermique globale.
Ajoutons les boucles de refroidissement optimisées avec récupération de chaleur vers des usages secondaires (chauffage des bureaux, préchauffage de l’eau).
Voilà pourquoi les datacenters modernes réévaluent leur enveloppe thermique globale : isolation renforcée pour minimiser les pertes et la charge sur les systèmes de refroidissement ; contrôle de flux d’air zoné, où le confinement chaud/froid limite les échanges non contrôlés d’air, améliorant l’efficacité ; systèmes HVAC à haute efficacité énergétique intégrant free cooling et récupérations d’énergie.
Conception systémique : coupler énergie et thermique
Les défis actuels exigent une vision intégrée de l’enveloppe électrique et thermique du datacenter. Des simulateurs CFD (Computational Fluid Dynamics) et des outils DCIM (Data Center Infrastructure Management) sont utilisés pour optimiser l’emplacement des racks, l’acheminement des fluides et l’équilibrage des charges.
Les standards émergents — comme les architectures de racks supportant simultanément HVDC et refroidissement liquide — deviennent des éléments clés de la conception.
En adoptant ces enveloppes électriques et thermiques modernisées, les opérateurs peuvent réduire significativement le PUE (Power Usage Effectiveness) en minimisant les pertes dans la conversion électrique et la dissipation thermique.Et améliorer l’efficacité énergétique globale grâce à des technologies comme la récupération de chaleur ou l’optimisation de la distribution électrique.

