Microsoft a récemment levé le voile sur sa nouvelle puce IA, Maia 200, conçue pour révolutionner le domaine de l’inférence. Avec des performances qui défient les standards actuels, la firme de Redmond se positionne en leader face à Amazon et Google dans le secteur des technologies de pointe.
L’essentiel à retenir
Conçue avec une finesse de gravure de 3 nanomètres par TSMC, la puce Maia 200 embarque plus de 140 milliards de transistors. Elle propose une puissance de calcul dépassant les 10 pétaFLOPS en précision FP4 et 5 pétaFLOPS en FP8. Cela lui permet d’exécuter les modèles d’intelligence artificielle les plus complexes avec une grande facilité.
Microsoft a également innové en revisitant le sous-système mémoire. La puce intègre 216 Go de mémoire HBM3e avec une bande passante de 7 To/s, ainsi que 272 Mo de SRAM. Ces améliorations garantissent un transfert de données efficace, maximisant ainsi les performances globales.
Par rapport aux solutions concurrentes, la Maia 200 affiche des performances remarquablement supérieures. En FP4, elle est trois fois plus performante que le Trainium 3 d’Amazon, tandis qu’en FP8, elle surpasse le TPU v7 de Google. Microsoft a su optimiser la consommation énergétique, maintenant une enveloppe thermique de 750 watts, un exploit pour ce niveau de performance.
La disponibilité immédiate de la puce aux États-Unis, notamment dans la région US Central de Microsoft, témoigne de l’avancement technologique de cette solution. Elle est déjà utilisée pour soutenir les derniers modèles d’OpenAI via Microsoft Foundry et Microsoft 365 Copilot.
L’architecture réseau du Maia 200 repose sur une conception Ethernet à deux niveaux, offrant 2,8 To/s de bande passante bidirectionnelle par accélérateur. Cette configuration permet la création de clusters pouvant comprendre jusqu’à 6 144 accélérateurs, évitant ainsi les infrastructures coûteuses et garantissant des performances constantes.
Pour soutenir les développeurs, Microsoft propose un kit de développement complet, comprenant une intégration PyTorch et un compilateur Triton. Cet ensemble d’outils permet une optimisation poussée des applications IA, renforçant l’approche vertically integrated de Microsoft.
Microsoft, fondée en 1975 par Bill Gates et Paul Allen, est devenue un acteur majeur dans le domaine des technologies de l’information. Au fil des décennies, l’entreprise a diversifié ses activités, s’engageant fortement dans le cloud computing et l’intelligence artificielle. Avec l’annonce de Maia 200, Microsoft continue de démontrer son engagement à innover et à repousser les limites de la technologie, consolidant ainsi sa position parmi les leaders mondiaux de l’industrie.