Afectación de varios servidores] 04/12/2018 16:04 – Fallo en autómata cuadro eléctrico

Comienzo de la incidencia: 16:06 del 04/12/2018

Problema:

– Pérdida de conectividad y reinicio de algunos servidores

– Causa del fallo: pérdida de alimentación eléctrica por fallo en autómata en cuadro eléctrico

– Tiempo de afectación del servicio: entre 60 minutos y 105 minutos

Esta tarde, un automata que controla uno de nuestros cuadros eléctricos en nuestro datacenter principal ha fallado y ha enviado la orden de apagado a los SAIs que controlaban 2 armarios rack , lo que ha llevado a la pérdida de conectividad y reinicio de alguno de los servidores.

Conforme se han ido recuperando las máquinas, algunos servicios han mostrado problemas y hemos tenido que ir conectándonos uno a uno a cada servidor para resolver las incidencias particulares.

Estamos trabajando con nuestro equipo de electricistas para introducir una capa de redundancia adicional para que este problema no pueda volver a suceder.

Lamentamos las molestias causadas.

El Equipo de Hacheté Diseños Web