Antes de partir la historia debo mencionar que Alibaba, el gigante asiático del comercio b2b, también tiene su plataforma de servicios cloud, su "nube" y es uno de los mayores proveedores de servicios cloud del mundo.
La historia cuenta que en diciembre de 2022, hace apenas un mes, la plataforma Cloud de Alibaba tuvo una falla en el sistema de refrigeración en su datacenter de Hong Kong (el nodo o región de una nube) que provocó el cese de servicios de muchos negocios ahí alojados. Entre esos servicios caídos estaba una casa de intercambio de criptomonedas como para que se vayan haciendo una idea del impacto que tuvo este evento.
Hacer las cuentas: ¿cuánto pierde tu negocio por cada día u hora si es que no tienes los sistemas arriba?
Ante una caída de servicios contratados se estila que el proveedor te compense no cobrándote por el lapso de tiempo en que no te brindó el servicio (como tanta generosidad, Dios mío). En este caso Alibaba corrió con plata para compensaciones, pero ese dinero retribuido es ínfimo en comparación a la pérdida por tener el negocio detenido.
No es raro que las empresas no consideren planes de contingencia porque "son caros y no se justifican, si al final las nubes casi nunca fallan". ¿Se imaginan un fallo de un datacenter de un servicio de ventas durante la semana previa a la navidad? Bueno, cuando finalmente fallan es cuando finalmente comienzan a hacer cuentas de cuánto dinero se pierde por estar sin servicio y que a lo mejor tener un sistema de contingencia no era tan mala idea.
Según estudios realizados, para el 60% de las compañías la pérdida económica de caídas de servicio tienen un costo de más de US$100.000 y existe un 15% de compañías cuya pérdida por caída de servicio es de más de 1 millón de dólares (en ese 15% se encuentra capa9) así que como ven, a la larga lo barato termina siendo caro.
Haciendo una analogía más mundana, imagínense que tengo un twingo y un ferrari (una taza vuela y me golpea en la cabeza)... nah. Imagínense que ustedes tienen un local de comida cuyo gancho es tener pantallas para proyectar partidos de fútbol los fines de semana con canal premium de futbol que llega por internet, y tu proveedor de internet te cobra 24 mil pesos mensuales lo que te da un costo de $800 por día y $33 la hora. Ahora ponle que tienes publicidad de "vea el superclásico acá" pero UNA HORA ANTES del partido se cae el servicio de futbol durante 3 horas, lo que significa que no pudiste transmitir el partido de fútbol.
La devolución de tu proveedor de internet por no haber podido entregarte el servicio durante 3 horas es de $100 pesos (una indigna moneda de gamba) pero evidentemente tu pérdida económica es mucho más. ¿Se hubiera justificado haber tenido contratado un segundo enlace de internet en caso de emergencia?
Probablemente ustedes ya lo han hecho pero igual es un buen ejercicio: hagan el cálculo de cuánto pierde su empresa, su institución, si es que sus sistemas están abajo durante un día.
Los ángeles caen, las nubes se caen
Shit happens. Hace un tiempo se apagó un datacenter de la nube de google por altas temperaturas en la ciudad (aguante el calentamiento global) y muchos servicios cayeron. También me acuerdo de que hace unos años un datacenter en el sector norte de Santiago sufrió corte parcial porque un vehículo chocó con un poste eléctrico colindante (tercer mundo, no trates de entenderlo). Así que como ven la probabilidad es muy baja pero real.
Los servicios de nube más importantes ofrecen métodos de contingencia que apuntan a otras regiones, de tal manera que si el datacenter del proveedor ubicado en Santiago que es donde corren tus sistemas falla, puedes inmediatamente activar tus servicios en un nodo de contingencia ubicado en Brasilia o en Kiev (una ciudad tranquila).
PD: tengo una anécdota sabrosa de una caída grandota que le ocurrió a la plataforma del transantiago que mostró que el ahorrarse un sistema de monitoreo provocó al final pérdidas cuantiosas.
Alibaba Cloud outage: why you need redundancy
This blog will examine the Alibaba Cloud outage as an example of why cloud users must include redundancy in their cloud Disaster Recovery plans.
dbvisit.com
Estudios del impacto de caídas de servicios
The True Cost of Downtime: 21 Stats You Need to Know
Explore 21 stats that show the true cost of downtime on your organization & ways to boost your resiliency to reduce outages & their effects.
trilio.io
Última modificación: