Quels enseignements tirer de la panne mondiale de Microsoft ?

Une mise à jour défectueuse de la solution de sécurité Crowdstrike a perturbé le fonctionnement de Windows et de Microsoft 365, une panne géante qui selon Microsoft aurait affecté près de 8,5 millions d’ordinateurs dans le monde. Quels enseignements peut-on en tirer ?

Un tribune d'Yves Grandmontagne, rédacteur en chef de Datacenter Magazine

Une première réflexion, alors que je ne m’étais pas encore engagé dans l’écriture de cette tribune : le numéro deux mondial de la cybersécurité Crowdstrike (15 % de parts de marché selon Gartner) a fait plier le numéro un mondial Microsoft (40% de parts de marché). Pour l’un comme pour l’autre, c’était théoriquement inévitable, sauf que l’on attendait une cyberattaque – ne dit-on pas que la question n’est pas de savoir si on va être attaqué, mais quand ? – et que finalement c’est une erreur humaine qui a eu raison de leurs prétentions…

De là vient le premier enseignement de cette affaire : nul n’est à l’abri d’une erreur humaine ! Celle-ci peut-être largement plus dévastatrice qu’une cyberattaque, en particulier car si tout est fait pour éviter ou limiter la seconde, la première est quasi inévitable car tellement humaine.

Là où la panne de Microsoft vient enrichir plus encore notre analyse, c’est qu’elle est venue d’un pratique qui se répand, celle de l’intégration et de la livraison continue. Dans le but de réduire le temps d’intégration des mises à jour ou modifications de code, celles-ci sont automatisées.

Les experts reprochent beaucoup aux organisations de trop tarder avant de faire des mises jour. Mais lorsque ces dernières contiennent du code défectueux, envoyées via le cloud à des milliers ou millions de clients à la fois, il n’est plus surprenant de constater l’ampleur, des dégâts.

Cela d’autant plus que l’erreur constatée ici va à l’encore d’une autre pratique pourtant largement répandue, celle de tester les mises à jour sur des postes et/ou des serveurs isolés afin de les tester et d’éviter… ce qu’a subi Microsoft.

Pourquoi alors avoir commis cette lourde erreur ? D’un côté s’impose la règle de la vitesse, il faut aller toujours plus vite, quitte à brûler les étapes. De l’autre, les clients sont tout autant responsables lorsqu’ils autorisent les mises à jours automatisées, sans prendre le temps de vérifier les correctifs et les versions, et sans mettre en face du risque les ressources nécessaires pour l’éviter.

Mais il s’agit là de pratiques, alors qu’un autre enseignement autrement plus insidieux s’impose : le danger que fait peser la consolidation des plateformes IT. Trois acteurs du marché occupent la majorité du marché du cloud. Et l’un d’eux est plus que largement majoritaire sur les postes de travail. L’exemple de la panne de Microsoft est significative de ce danger : la panne a été mondiale, elle a paralysé une partie du transport (aéroports et trains), des banques, des médias, des services publics, etc. Pour un acteur impacté, c’est le monde qui tremble.

Nos économies, nos entreprises, nos administrations, nos emplois dépendent désormais d’une poignée d’acteurs qui peuvent, volontairement ou dans l’erreur, dicter nos activités, nos pratiques, nos comportements, jusqu’à notre vies sociales. Et les politiques, dont certains n’ont pas hésité à s’emparer de l’événement sans maîtriser l’information, en partie erronée, qu’ils ont diffusée, ne sont pas à épargner.

Dans quel monde vit-on aujourd’hui ? Permettez-moi de faire de cette réflexion le dernier enseignement que m’inspire la panne géante de Microsoft. Mais ne soyez pas rassurés, ce ne sera certainement pas la dernière, ni la plus massive.

à lire