Les racks classiques pour datacenters ne répondent pas aux exigences des cartes serveurs qui intègrent les nouvelles puces pour l’IA… Alors Microsoft a revu la conception des racks serveurs de l’IA.
Image d’entête : le nouveau rack Microsoft pour Maia 100 AI Accelerator avec à gauche son ‘sidekick’ testés en chambre thermique dans un lab Microsoft de Redmond.
Microsoft a conçu une nouvelle puce Maia AI Accelerator destinée à la pile matérielle de son cloud Azure et optimisée pour les tâches d’IA (intelligence artificielle) et l’IA générative. Il généralise également dans ses datacenters le processeur Microsoft Azure Cobalt, basé sur Arm, conçu pour exécuter des charges de travail de calcul à usage général sur le cloud Microsoft Azure.
Cette stratégie de nouvelles infrastructures IT destinées à l’IA pousse Microsoft à réinventer la conception de ses datacenters et à intégrer les couches IA dans les piles IT afin « de maximiser les performances, de diversifier notre chaîne d’approvisionnement et de donner aux clients le choix de l’infrastructure » selon Scott Guthrie, vice-président exécutif du groupe Cloud + AI de Microsoft, qui est intervenu sur Microsoft Ignite.
A nouveaux serveurs, nouveaux racks
- Microsoft construit donc des racks personnalisés plus larges, pour offrir plus d’espace pour les câbles d’alimentation et de réseau.
- Les méthodes traditionnelles de refroidissement par air se révélant insuffisantes pour les puces haute performance (comme Maia AI Accelerator et les GPU Nvidia), pour limiter la surchauffe Microsoft privilégie la solution industrielle du refroidissement liquide.
- Microsoft a également développé un élément ‘sidekick’ placé à côté du rack Maia qui permet l’écoulement du liquide froid vers les plaques situées à la surface des composants. Ces plaques comportent des canaux pour la circulation du liquide, l’absorption et le transport de la chaleur. Cette chaleur est ensuite éliminée lors de l’écoulement du liquide dans le ‘sidekick’.
Le rack et son acolyte ont été conçus en tandem. Leur design a été rendu public par Microsoft à destination de ses partenaires. Et il sera revu pour répondre aux futures générations des séries Azure Maia AI Accelerator et de la série Azure Cobalt CPU en optimisant chaque couche de sa pile technologique.