AWS cherche à se distinguer par ses processeurs

© AWS
Dries Van Damme

Dans l’ombre de la course à l’IA se déroule une seconde compétition: celle de l’infrastructure la plus puissante. AWS entre dans la danse, non seulement avec ses serveurs, mais aussi avec ses processeurs.

La taille et la complexité des nouveaux modèles d’IA ne cessent de croître, engendrant des exigences toujours plus importantes en matière de puissance de calcul et de ressources réseau. Le secteur de l’IA recherche constamment des solutions permettant de réduire les durées de formation et d’inférence. Or, cela nécessite des investissements en infrastructure que seules les très grandes entreprises peuvent se permettre. Et même dans ce cas, comme cela a été souligné lors de la conférence des utilisateurs AWS re:Invent à Las Vegas, même avec les instances les plus rapides disponibles aujourd’hui, il est impossible de construire indéfiniment des clusters de calcul toujours plus grands. La technologie atteint inévitablement ses limites: ‘plus grand’ ne signifie plus simplement ‘plus rapide’. 

AWS affirme résoudre ce problème avec une nouvelle génération de serveurs appelés Amazon EC2 Trn3 UltraServers et équipés de la nouvelle puce Trainium3, construite sur base de la technologie 3 nm. 

Ali Saidi. © AWS

Les nouveaux serveurs sont conçus pour former plus rapidement des modèles d’IA plus volumineux, permettant ainsi de réaliser des projets d’IA de plus grande envergure. Concrètement, les UltraServers Trn3 intègrent 144 puces Trainium3, offrant au système une puissance de calcul 4,4 fois supérieure à celle de la génération précédente d’UltraServers Trainium2. Dans la pratique, cela réduit les durées de formation de plusieurs mois à quelques semaines. Lors de tests effectués avec le modèle GPT-OSS d’OpenAI, les UltraServers Trn3 ont permis d’obtenir des réponses quatre fois plus rapidement. Selon Matt Garman, CEO d’AWS, le modèle d’IA d’Anthropics, Claude, est actuellement formé sur Trainium3. Cette solution coûterait deux fois moins cher qu’une formation sur GPU. 

Ecosystème propre 

Entre-temps, AWS continue de miser sur les processeurs Graviton, dont la cinquième génération a été annoncée lors de re:Invent. Précisons que Graviton est un CPU, et non un GPU. Ces processeurs sont basés sur l’architecture ARM et ne peuvent donc être comparés aux processeurs x86 classiques d’Intel et d’AMD. ‘Lors du lancement de la première génération de Graviton en 2018, les gens s’interrogeaient surtout sur nos motivations’, explique Ali Saidi, VP & Distinguised Engineer chez AWS. La raison était pourtant évidente: AWS est un client majeur des fondeurs de puces et souhaite réduire sa dépendance à leur égard. ‘Notre priorité est de construire notre propre écosystème’, affirme l’entreprise. Un choix judicieux, surtout face à la pression croissante exercée sur l’approvisionnement en puces. 

Depuis 2018, les différentes générations de Graviton se sont succédé à un rythme soutenu, chacune offrant un éventail d’applications plus large. Selon AWS, quelque 90.000 entreprises dans le monde utilisent Graviton, dont de grands noms tels Adobe et Stripe. Le célèbre jeu Fortnite tournerait également sur Graviton. 

‘Graviton est principalement destiné aux applications web, aux bases de données et aux médias’, explique Aid Saidi. Graviton5 étend désormais encore davantage les possibilités. AWS regroupe 192 cœurs de CPU sur chaque puce, ce qui représente un quart de puissance de calcul supplémentaire. ‘Cela nous permet, entre autres, de faire tourner des charges de travail d’apprentissage machine sans avoir recours à des GPU. Globalement, Graviton5 contribue à des applications à latence fortement réduite.’ 

Une puissance de calcul accrue par puce se traduit également par une meilleure rentabilité. ‘En clair, vous aurez désormais besoin d’un quart d’instances en moins. Cela libèrera du budget pour d’autres projets’, conclut Saidi.

AWS considère aussi le cloud souverain comme une forme de reprise après sinistre

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Expertise Partenaire