Audits de maintenance et d’exploitation de datacenters : quand, pourquoi et comment les réaliser ?

Par Gabriel Dias, responsable exploitation et maintenance, APL

Des audits récurrents des contrats d’exploitation et de maintenance des datacenters sont indispensables tout au long de leur cycle de vie pour vérifier que les procédures sont en phase avec les objectifs de qualité de service, les optimiser, les mettre à jour lors des renouvellements de contrats ou encore réduire les coûts. Quand, pourquoi et comment les réaliser ?

Dans quels contextes et pourquoi réaliser un audit de maintenance ?

Clés de voûte des systèmes d’information des organisations, les datacenters constituent un patrimoine qu’il s’agit d’entretenir et d’améliorer au fil des années pour qu’ils atteignent les niveaux de continuité de service, de sécurité et d’efficacité énergétique attendus : c’est tout l’objectif des actions entreprises en matière d’exploitation et de maintenance.

Opérées en interne ou en externe, ces actions impliquent des points d’étapes réguliers. De nombreux contextes peuvent ainsi conduire à la réalisation d’un audit de maintenance et d’exploitation d’un datacenter tels qu’un changement de personnel sur site, l’apparition plus ou moins régulière de problèmes de performances voire de disponibilité, l’inadéquation entre les installations et l’évolution des besoins, la volonté de réduire les coûts d’exploitation ou encore la réalisation d’un bilan – sur ce qui a bien ou moins bien fonctionné – lors du renouvellement du marché exploitation et maintenance.

Dans tous les cas, un audit de maintenance et d’exploitation a pour objectif de mesurer le différentiel entre ce qui est attendu et ce qui est effectivement réalisé, de définir les leviers d’améliorations potentielles, mais aussi de disposer d’éléments concrets pour définir ou redéfinir les priorités.

En quoi consiste cet audit ?

L’audit de maintenance et d’exploitation est une procédure très complète qui couvre des aspects contractuels, procéduraux et bien sûr techniques. Il se compose d’éléments :

  • d’analyses (audit de la salle, inventaire des équipements techniques, procédures et protocoles d’exploitation et de maintenance) ;
  • d’évaluation de l’existant (audit de maintenance et des contrats passés avec les différents prestataires, évaluation et tests de leurs interventions, identification des points de faiblesse pour la sécurité, la continuité d’activité, et la reprise en cas d’incident) ;
  • de propositions d’axes potentiels d’amélioration (préconisations et programmes d’améliorations, estimation des gains réalisables : qualité de service, réduction des coûts d’exploitation, etc.).

Il est réalisé en deux phases, que l’on peut qualifier de théorique pour l’une et pratique pour l’autre.

Phase 1 : l’étude documentaire

Afin de disposer d’une visibilité complète des installations, procédures et interventions, un audit de maintenance et d’exploitation de datacenter commence, d’une part, par une étude du Dossier des Ouvrages Exécutés : dimensionnement, fonctionnement du site, correspondance par rapport aux besoins fonctionnels (Tier III…). Et d’autre part, par l’analyse des documents d’exploitation : procédures mises en œuvre sur le site (accès, escalade, fiches réflexes…), des interventions (bons d’interventions, du respect des garanties de temps de d’intervention GTI et de réparation GTR), des suivis de consommation énergétiques et le stock de pièces détachées, ou encore des faits marquants (changement de personnel, astreintes, pannes, remplacements, principales tâches correctives et préventives réalisées, devis émis par les prestataires, etc.).

Cette étude documentaire a pour objet de s’assurer que l’exploitation et la maintenance a bien été réalisée dans les règles de l’art et conformément à ce qui avait été prévu, sur une période donnée. Ainsi, des documents absents ou insuffisamment renseignés dans le temps peuvent être un signal d’un certain manque de rigueur dans l’exécution des tâches dédiées de maintenance et d’exploitation, ce qui implique de creuser plus en profondeur lors de la visite sur site.

Phase 2 : la visite technique du site

Quel que soit le résultat de l’étude documentaire, une visite technique sur place s’impose. Cette visite a pour objet de s’assurer de la cohérence entre la documentation et l’existant (équipements en fonctionnement et interventions réalisées), de réaliser un inventaire complet des équipements (systèmes d’alimentation électrique, climatiques, onduleurs…), et de leur état (éléments non chargés, filtres sales, etc.).

De façon générale, cette visite technique doit être aussi l’occasion de comprendre les ajouts d’éléments matériels réalisés au fil de l’eau (pourquoi, comment, pour quels besoins répondus, quelle maintenance ?), d’apprécier les outils de supervision et les alarmes mises en place, et d’évaluer concrètement les interventions de maintenance corrective et préventive réalisées (delta avec le contenu des bons d’intervention).

En conclusion, les éléments recueillis lors de l’audit doivent permettre aux organisations de mieux comprendre les coûts associés à leur data center, et de faire les bons choix en matière d’exploitation et de maintenance, afin de gagner en performances et prolonger dans les meilleures conditions la durée de vie de leurs équipements.

à lire