L’inférence de l’IA se fera en edge, mais pas dans les datacenters !

Selon Mark Papermaster, directeur de la technologie (CTO) d’AMD, à mesure que l’inférence se développe – l’inférence, c’est le processus de nos usages de l’IA qui génère des résultats en réponse aux questions ou créations d’images (prompts) après l’entraînement des LLM, les langages massifs dans des datacenters hyperscale spécialisés IA -, elle se dirige vers la périphérie, non pas vers les datacenters Edge mais vers les ‘edge devices’ comme les ordinateurs portables ou les smartphones.

à lire