Cloudflare : une panne de six heures secoue l’Internet mondial

Cloudflare : une panne de six heures secoue l’Internet mondial

En l’espace de quelques heures, le géant de l’infrastructure Internet, Cloudflare, a plongé une partie du web dans le chaos. Retour sur les événements qui ont mené à cette panne inédite depuis 2019 et les leçons tirées par l’entreprise.

Résumé en 3 points
– Mardi 18 novembre 2025, une panne majeure de Cloudflare a perturbé l’accès à de nombreux services en ligne dans le monde entier.
– La cause initiale de la panne était une modification technique sur les bases de données, entraînant des erreurs massives dans le système de gestion des bots.
– Cloudflare promet des changements structurels pour prévenir de telles situations à l’avenir.

Les origines de la panne

La panne a débuté le mardi 18 novembre 2025 à 12h20, suite à une modification sur un cluster de bases de données ClickHouse. L’objectif était de renforcer la sécurité des accès aux données, mais ce changement a provoqué un effet de bord inattendu. Les métadonnées des bases de données ont été dupliquées, ce qui a entraîné une surcharge du fichier utilisé par le système Bot Management de Cloudflare. Avec plus de 200 entrées au lieu des 60 habituelles, le fichier dépassait la limite de sécurité, générant une cascade d’erreurs 500 sur les serveurs du réseau.

Réactions et diagnostic

Face à ces perturbations, Cloudflare a d’abord suspecté une attaque DDoS, une hypothèse alimentée par des erreurs sporadiques et l’instabilité des services. Les équipes ont tenté diverses solutions, allant de la restriction du trafic à la gestion des comptes utilisateurs, avant de découvrir que la véritable origine du problème était interne.

À lire  Les enjeux du rachat de TikTok : Franck McCourt s'oppose à l'accord soutenu par Donald Trump

C’est en contournant le système principal pour le service Workers KV qu’une amélioration a été constatée, permettant aux équipes d’identifier le fichier Bot Management comme source du dysfonctionnement. Le retour à une version antérieure du fichier a permis de rétablir progressivement le trafic.

Impact sur les services et utilisateurs

Durant cette panne, des services majeurs comme Canva, X/Twitter, ou encore ChatGPT ont été affectés. Le système anti-bot Turnstile et la plateforme Workers KV ont également connu des défaillances, rendant le tableau de bord Cloudflare inaccessible. L’impact a été particulièrement marqué sur Cloudflare Access, empêchant de nombreux employés en télétravail d’accéder aux ressources internes de leur entreprise.

La migration vers une nouvelle version du proxy FL2 a aussi contribué aux dysfonctionnements, les utilisateurs sur cette version rencontrant des erreurs répétées.

Leçons et améliorations prévues

Matthew Prince, PDG de Cloudflare, a publiquement reconnu les erreurs commises et s’est engagé à mettre en œuvre des changements structurels pour éviter de futures pannes. Parmi les mesures annoncées figurent une validation stricte des fichiers de configuration internes et l’ajout de « coupe-circuits » pour désactiver rapidement les fonctionnalités défectueuses.

Cloudflare prévoit également de limiter la consommation de ressources lors de la génération de rapports d’erreur, ces derniers ayant ralenti le traitement des requêtes légitimes pendant la panne. L’entreprise, qui soutient 20% des sites Internet, apprend de cette expérience pour renforcer la résilience de ses systèmes.

Cloudflare : un pilier du web moderne

Fondée en 2009, Cloudflare est devenue l’une des principales entreprises de services réseau et de sécurité Internet. Elle offre des solutions de performance, de sécurité, et des services d’infrastructure pour une part significative du web mondial. Cette panne rappelle la complexité et la fragilité des systèmes modernes, où chaque modification peut avoir des répercussions considérables.

À lire  Étude sur l'impact des campagnes antipiratage : une nouvelle approche pour réduire le piratage

Depuis sa dernière panne majeure en 2019, Cloudflare a constamment évolué pour répondre aux défis croissants de la cybersécurité et de la gestion de trafic. En promettant de nouvelles mesures de sécurité et de gestion, l’entreprise s’efforce de maintenir sa position de leader tout en assurant la stabilité et la fiabilité de ses services.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *