L’IA invite à repenser le datacenter

L’adoption rapide de l’IA, entraînée par l’IA générative, va multiplier les workloads et leur puissance, et donc peser sur les infrastructures de datacenters et sur leur consommation énergétique. En 2028, l’IA devrait représenter jusqu’à 20% de l’énergie globale des datacenters.

Tribune de Yves Grandmontagne, Rédacteur en chef de DCmag

L’adoption de l’IA a un impact sur la densité de l’infrastructure des datacenters. La puissance des systèmes de calcul impose d’augmenter singulièrement la puissance au niveau des racks, leur densité et leur poids. L’impact porte également sur les équipements électriques, de refroidissement et de réseaux, ce qui a pour effet d’augmenter plus encore la consommation énergétique.

Dans une étude récente, Schneider Electric affirme que « D’ici 2028, les charges de travail de l’IA représenteront jusqu’à 20 % de l’énergie totale des datacenters« .

L’Agence internationale de l’énergie (AIE), estime quant à elle que l’augmentation des charges de travail HPC, IA, ML et autres entraîne une élévation annuelle de 20% à 40% de la consommation énergétique mondiale des datacenters.

Consommation énergétique, tension électrique, refroidissement

Cette augmentation de la puissance énergétique va peser sur la tension électrique des équipements en place, les blocs de distribution électrique actuellement en place ne sont plus adaptés, et l’élévation des températures va augmenter les risques de pannes, voire mettre des installations en danger.

Dans les datacenters dotés de clusters HPC et IA, le refroidissement par air n’est plus suffisant. Le déploiement du refroidissement liquide devient une solution nécessaire dans les parties du datacenter consacrées au calcul. Cette solution s’annonce plus fiable, plus performante, elle occupe moins d’espace, et consomme moins d’eau.

Piloter et automatiser, limiter les risques

Enfin, l’IA va avoir un effet massif sur le pilotage des datacenters. La conception puis la gestion des clusters d’IA rend indispensable l’usage d’outils comme DCIM, BMS, conception électrique et jumeaux numériques. L’urbanisation des salles doit être repensée. Les contraintes d’alimentation et de refroidissement doivent être intégrées afin de limiter le risque opérationnel.

Quant à l’automatisation, par un juste retour en partie pilotée par l’IA, elle va permettre de limiter le risque humain, donc les erreurs susceptibles d’entraîner de très coûteux temps d’arrêt.

à lire