Cloudflare: qué pasó realmente y por qué no fue un hackeo

Recientemente, una interrupción en los servicios de Cloudflare generó caos en internet durante más de dos horas. Aunque muchos pensaron en un posible ataque cibernético, la empresa confirmó que no se trató de una brecha de seguridad, y que no hubo pérdida de datos. ¿Qué fue lo que falló? Todo comenzó con una falla inesperada …

Antonela Arenas

Recientemente, una interrupción en los servicios de Cloudflare generó caos en internet durante más de dos horas. Aunque muchos pensaron en un posible ataque cibernético, la empresa confirmó que no se trató de una brecha de seguridad, y que no hubo pérdida de datos.

¿Qué fue lo que falló?

Todo comenzó con una falla inesperada en Workers KV, una base de datos clave-valor distribuida que cumple un rol central en muchos servicios de Cloudflare. Este componente, utilizado para almacenar configuraciones, autenticaciones y archivos, depende parcialmente de un proveedor de nube externo, que tuvo una caída generalizada.

Cuando ese proveedor falló, el almacenamiento detrás de Workers KV dejó de funcionar y esto afectó desde procesos de autenticación hasta servicios de streaming, navegación y despliegue de sitios web.

Los efectos colaterales fueron enormes

Aunque el origen fue un solo componente, el impacto fue en cadena:

  • • Servicios como WARP, Access y Gateway no pudieron verificar identidades ni políticas.
  • • El sistema CAPTCHA y el login de Turnstile fallaron, activando medidas de emergencia.
  • • El sistema de streaming de Cloudflare quedó inutilizable.
  • • Los servicios de inteligencia artificial como Workers AI dejaron de responder.
  • • Plataformas de imágenes, sitios y archivos estáticos no pudieron cargar ni funcionar correctamente.
  • • Incluso la creación de nuevos procesos en Workers falló al 100% durante el incidente.

Un dato llamativo: Las imágenes que se subían a través de los servidores de Cloudflare tenían un 0% de éxito. Ninguna se procesó correctamente.

¿Cómo se soluciona esto?

Cloudflare anunció que va a reducir su dependencia de proveedores externos, comenzando por migrar progresivamente Workers KV a su propio sistema de almacenamiento R2. También planea reforzar la resiliencia interna con herramientas de recuperación gradual que eviten el colapso en masa ante futuras fallas.

La caída también afectó indirectamente a servicios de Google Cloud, lo que demuestra cómo un error en una infraestructura puede sacudir a todo el ecosistema digital global.

¿Qué aprendimos?

Aunque no hubo ciberataque, este tipo de incidentes muestra la importancia de pensar en arquitectura distribuida real y no poner todos los sistemas críticos en la misma canasta (ni siquiera si es de un gigante del cloud).

Un sistema puede estar altamente disponible… hasta que no lo está.

Y vos… ¿Estás preparado para que tu infraestructura aguante el próximo temblor?

 

Cloudflare: qué pasó realmente y por qué no fue un hackeo

Esta nota habla de: