Face à l’interruption du trading, CyrusOne a installé une capacité de refroidissement de secours temporaire

Cette histoire se déroule dans le datacenter CHI1 de CyrusOne, à Aurora (Chicago), qui héberge des plateformes de trading du plus grand opérateur boursier, CME Group. Victime d’une panne de refroidissement de plusieurs heures qui a interrompu le marché des échanges de contrats à terme, CyrusOne a été contraint de renforcer sa capacité de secours de refroidissement.

CME Group est un grand opérateur boursier mondial – échanges de contrats à terme : actions, obligations, de matières premières et devises. Ses solutions de trading sont hébergées dans un datacenter situé à Aurora, près de Chicago dans l’Illinois, que le groupe a cédé à CyrusOne voici quelques années, et dont il demeure un locataire majeur.

Le 27 novembre dernier, le datacenter CHI1 de CyrusOne a subi une panne de plusieurs heures, une défaillance d’un circuit de refroidissement, qui a provoqué l’arrêt, la suspension ou la limitation temporaire de plusieurs plateformes de trading de CME Group, interrompant les échanges.

CyrusOne a déclaré avoir installé une capacité de refroidissement de secours supplémentaire — des chillers temporaires et travaux de tuyauterie — pour stabiliser la situation et renforcer la résilience du site.

Les équipes d’ingénierie de CyrusOne ont travaillé sur place pour remettre le système principal en service et, en parallèle, déployer des équipements de refroidissement de secours afin de réduire le risque d’une répétition. Les comptes rendus indiquent qu’il s’agissait d’éléments provisoires : chillers supplémentaires et raccordements de tuyauterie pour augmenter la capacité de secours, compléter la redondance existante, pour restaurer et renforcer la résilience pendant que le système principal est stabilisé.

Faire face aux risques résiduels

L’incident met en lumière la fragilité potentielle des services numériques critiques face à des défaillances d’infrastructure physique. Les datacenters concentrent des équipements très énergivores : un arrêt ou une dégradation du refroidissement peut provoquer surchauffe, réductions de fréquence, voire arrêts d’équipement pour protéger le matériel. Les opérateurs conçoivent normalement des architectures redondantes (N+1, 2N) sur la partie alimentation électrique et refroidissement ; néanmoins, la coordination entre équipements principaux et systèmes de secours, la maintenance et la visibilité (télémétrie – capter et analyser en continu les données des chillers, vibrations, pression, consommation, températures, afin de prévoir des défaillances) sont des facteurs déterminants.

La leçon est claire : redondance testée, observabilité accrue et plans de secours robustes sont désormais des exigences opérationnelles, pas seulement de la théorie.

à lire