Un hyperscaler non cité – il pourrait s’agir de Meta – pourrait déployer aux Etats-Unis, mais loin des grands hubs, une vingtaine de datacenters Edge modulaires d’inférence de l’IA jusqu’à 10 MW. Un modèle à suivre…
Tribune par Yves Grandmontagne, rédacteur en chef de DCmag
Aux Etats-Unis, où les projets prennent la dimension de la démesure d’immenses territoires, la stratégie des hyperscalers engagés dans l’IA pourrait changer. Selon un modèle qui à une échelle plus adaptée devrait se dupliquer dans nos contrées.
Jusqu’à présent, tirés par l’IA et l’ambition de ne pas rater cette marche technologique, les hyperscalers investissent dans les méga campus et méga datacenters destinés au cloud et à l’entraînement des grands modèles de langage (LLM). Pour des questions techniques, de disponibilité, d’interconnexions, ces infrastructures prennent place dans les grands hubs des métropoles.
Mais passé le modèle des LLM, la demande s’appuie sur les infrastructures d’inférence pour traiter non plus les langages mais les usages de l’IA. Ces infrastructures doivent répondre à des demandes de disponibilité, de latence et de redondance. Ce qui se traduira à terme par la présence de relais d’IA sur des territoires éloignés des hubs mais proches des utilisateurs.
En France, cela se traduirait par le stockage des données du cloud et l’entraînement de l’IA dans des grands datacenters parisiens, et l’exécution des usages et de l’inférence dans des plus petits datacenters sur les territoires.
Projet Edge-AI d’un hyperscaler américain
Un projet de 20 datacenters Edge d’inférence de l’IA déployés par un hyperscaler dans des villes américaines et non plus dans métropoles vient confirmer ce modèle. Ces datacenters Edge modulaires, d’une puissance de 5 à 10 MW (l’équivalent d’un datacenter français en région), d’un coût unitaires de 50 à 100 millions de dollars, et destinés à un seul locataire pour des milliers de clients utilisateurs, seront construits dans des villes à proximité de ces utilisateurs.
Ajoutons que ces datacenters Edge, au-delà de répondre à la latence et à la redondance, sont également une réponse au manque de ressources qui pointe sur les hubs. Foncier plus accessible, électricité plus disponible, construction plus rapide par phase de 1 à 2 GW, investissements dimentionnés, et des clients également plus proches.
Le modèle hypercalers dans les hubs, et pour les masses de données cloud et entraînement IA. Relayé en région et sur les territoires par des datacenters Edge de proximité pour les usages et l’inférence, moins gourmands, plus attractifs, et plus proches dans la relation commerciale, il devrait trouver sa place en Europe.