Lundi matin, une panne d’envergure a frappé Amazon Web Services (AWS), provoquant des dysfonctionnements majeurs sur plusieurs plateformes populaires comme Snapchat et Fortnite. Alors que la situation commence à s’améliorer, retour sur les origines et les conséquences de cet incident qui a rappelé la fragilité de notre dépendance numérique.
Résumé en 3 points
Le lundi matin a été marqué par une perturbation significative dans le fonctionnement d’Amazon Web Services, entraînant l’interruption de nombreuses applications et sites populaires. La cause identifiée était un problème dans la résolution DNS, un élément essentiel qui permet aux services de retrouver les adresses nécessaires pour fonctionner correctement. Ce dysfonctionnement a particulièrement affecté DynamoDB, une base de données cruciale pour le stockage et la récupération d’informations.
La panne a été localisée dans les data centers d’Amazon situés en Virginie, dans la région US-EAST-1. Ce « grain de sable » a suffi à mettre à mal des dizaines de plateformes à travers le monde, démontrant la vulnérabilité d’une infrastructure centralisée.
Les ingénieurs d’AWS ont travaillé d’arrache-pied pour résoudre cette panne. Ils ont annoncé avoir corrigé le problème DNS, permettant un retour progressif à la normale des services touchés. Les équipes continuent de déployer des correctifs pour les zones encore impactées, signalant des progrès notamment sur le redémarrage des serveurs virtuels EC2.
Amazon a également indiqué que deux services critiques, EventBridge et CloudTrail, reprenaient activement leur traitement normal, tandis que le service Lambda a retrouvé sa capacité à gérer les files d’attente SQS.
Cette panne d’AWS a révélé la dépendance de nombreux services numériques sur une infrastructure centralisée. Avec 63 services impactés et seulement 37 rétablis dans l’après-midi, des millions d’utilisateurs ont été confrontés à des interruptions de service. Les perturbations ont touché des plateformes variées, des jeux vidéo aux outils de création en ligne, soulignant l’importance des infrastructures de cloud dans notre quotidien.
Amazon a multiplié les communications via son tableau de bord pour informer ses clients en temps réel des progrès réalisés. Toutefois, la situation a rappelé à quel point notre monde numérique repose sur un nombre limité de fournisseurs de services cloud.
Amazon Web Services, une filiale d’Amazon.com, est l’un des principaux fournisseurs de services de cloud computing à l’échelle mondiale. Fondée en 2006, AWS offre une gamme complète de services cloud, allant du stockage de données aux solutions de machine learning. Sa position de leader sur le marché du cloud résulte de sa capacité à fournir des infrastructures fiables et flexibles, bien qu’incidents comme celui de lundi rappellent les défis associés à la centralisation des services numériques.
Cette panne illustre les enjeux auxquels AWS est confronté pour maintenir sa réputation de fiabilité, tout en renforçant ses systèmes pour prévenir de futurs incidents d’une telle ampleur.