Néoclouds ou GPU as-a-Service : la prudence s’impose

Lors de Metro Connect USA 2026, de nombreuses voix se sont élevées, s’interrogeant sur les néoclouds. Au point qu’aujourd’hui la question ne serait pas de savoir si ces acteurs disparaîtront, mais lesquels survivront, et sous quelles conditions !

Tribune par Yves Grandmontagne, Rédacteur en chef de DCmag

Portés par l’explosion de l’IA générative, les néoclouds, des acteurs spécialisés dans la location de GPU à la demande (GPU as-a-Service), se sont imposés en quelques années comme une alternative aux hyperscalers traditionnels. En proposant des capacités massives de calcul à des prix parfois inférieurs, des entreprises comme CoreWeave, Lambda ou Vast.ai séduisent.

Mais derrière cette croissance fulgurante se cache une série de risques techniques, économiques, énergétiques et géopolitiques encore largement sous-estimés. A commencer le modèle économique des néoclouds qui repose presque exclusivement sur l’accès massif aux GPU de pointe, principalement fournis par un seul acteur : Nvidia.

Dépendance est source de vulnérabilités

    Cette dépendance crée plusieurs vulnérabilités :

    • Risque d’approvisionnement : toute tension sur la chaîne logistique (sanctions, restrictions à l’export, priorisation des hyperscalers) peut mettre en péril l’activité.
    • Asymétrie de pouvoir : Nvidia impose ses feuilles de route, ses prix et ses architectures logicielles (CUDA), laissant peu de marge de manœuvre aux opérateurs.
    • Obsolescence accélérée : un parc GPU devient rapidement non compétitif face aux nouvelles générations, pesant lourdement sur les bilans financiers.

    Le constat est sans appel, contrairement aux hyperscalers, les néoclouds disposent de peu de leviers pour absorber ces chocs. De plus, le modèle financier est fragile et très capitalistique. Les entreprises de GPU as a Service doivent investir des milliards de dollars en CAPEX avant même d’avoir une visibilité claire sur la demande à moyen terme.

      Les dangers sont donc multiples :

      • Effet de levier excessif : certaines structures financent leurs GPU par de la dette, adossée à des hypothèses de taux d’utilisation élevés.
      • Volatilité de la demande IA : l’entraînement de grands modèles n’est pas continu ; une fois les modèles stabilisés, les besoins chutent.
      • Compression des marges : la concurrence intense entraîne une guerre des prix, alors que les coûts fixes (énergie, refroidissement, maintenance) restent élevés.

      Un retournement du marché de l’IA ou une rationalisation des dépenses des grands clients pourrait provoquer des faillites en chaîne.

      À la différence des clouds historiques, beaucoup de néoclouds exploitent un nombre limité de sites. Ils disposent de peu de redondance géographique et n’ont pas toujours des certifications complètes (Tier III/IV, ISO 27001, SOC 2). Cela expose les clients à des interruptions de service majeures, des pertes de données, des SLA moins robustes que ceux des hyperscalers. Pour des workloads critiques (santé, défense, finance, infrastructures publiques), ces limites posent un véritable problème de souveraineté et de continuité d’activité.

        Les questions énergétiques et de sécurité doivent être posées

          Les clusters GPU consomment jusqu’à 5 à 10 fois plus d’énergie par rack qu’un datacenter classique. Les néoclouds, souvent installés rapidement dans des zones opportunistes, se heurtent à des réseaux électriques sous-dimensionnés, une dépendance aux énergies fossiles, et une opposition croissante des collectivités locales.

          Sur la sécurité des données, le modèle GPU as a Service implique souvent un partage d’infrastructures entre clients, des environnements moins matures en matière de cybersécurité, et une gouvernance floue sur la localisation et la protection des données. Cela soulève des questions majeures de conformité réglementaire, en particulier pour les entreprises ou les administrations européennes, notamment vis-à-vis du RGPD et des lois extraterritoriales américaines.

          Un risque systémique pour l’écosystème IA

              La prolifération des néoclouds crée une illusion d’abondance de calcul. Or, cette capacité repose sur une concentration extrême des fournisseurs de GPU, une consommation énergétique exponentielle, et des modèles financiers instables. En cas de crise (énergétique, géopolitique ou financière), une part significative de la capacité mondiale de calcul IA pourrait disparaître brutalement, affectant la recherche, l’industrie et les services publics.

              Les néoclouds et le GPU as a Service jouent un rôle clé dans l’accélération de l’innovation en IA. Mais leur modèle présente des fragilités structurelles qui en font des acteurs à haut risque, tant pour leurs clients que pour les territoires qui les accueillent. Pour résumer, les néoclouds sont un outil puissant, mais à manier avec prudence…

              à lire