25% Menos Primer Pago
Código al Pagar: APEX25
Posted: Mar 17, 2020 in Noticias de la Compañía
Como muchos de ustedes experimentaron hoy, hubo una cantidad significativa de tiempo de inactividad al poder acceder a su servidor, panel de control y FTP. Queremos disculparnos profundamente por esto y explicar exactamente qué sucedió, por qué sucedió y cómo nos aseguraremos de que no suceda en el futuro.
Cómo pasó esto ?
Hoy planeamos hacer una actualización del panel de control que se esperaba que fuera un proceso de 15 minutos, ya que tenía una actualización central que requería que actualizáramos todos los nodos al mismo tiempo en lugar de una implementación regional. Por lo general, cuando hacemos una actualización, esto se hace por región en lugar de hacerlo todo a la vez. Queríamos tratar de hacer esto lo más rápido y fluido posible para evitar largos períodos de inactividad. Sin embargo, algunos de nuestros nodos se ejecutaban en la versión CentOS6 de Linux que no era compatible con esta nueva actualización. Esto no se esperaba y afectó a 7 nodos que estaban en este sistema operativo heredado. Estos nodos específicamente tenían que revertir las versiones del panel y luego reiniciarse nuevamente para que permanecieran en línea. Esto requirió algunos ajustes de configuración adicionales para volver a ponerlos en línea y resultó en un tiempo de inactividad prolongado para estos 7 nodos.
Mientras esto sucedía, ocurrió un evento completamente no relacionado en dos de nuestros centros de datos, lo que resultó en la caída de los nodos en esos centros de datos. Nos comunicamos de inmediato con nuestros centros de datos para obtener una solución, pero lamentablemente les tomó tiempo resolver el problema y volver a poner la red en línea. Para algunos de nuestros usuarios, esto provocó un tiempo de inactividad adicional no relacionado con la actualización del panel de control.
Se informó al personal de la actualización del panel de control que se avecinaba, pero se perdió una parte crítica de nuestro flujo de trabajo y no notificamos adecuadamente a nuestros clientes sobre el tiempo de inactividad entrante para la actualización. Nos disculpamos nuevamente por esto, ya que todos deberían haber sido notificados antes de la actualización para asegurarse de que estuvieran preparados para la actualización de mantenimiento.
Avanzando hacia el futuro.
Hemos aprendido mucho de esto y descubierto lo que hicimos mal para asegurarnos de que algo de esta escala no vuelva a suceder. Vamos a tener muchas más verificaciones en segundo plano para garantizar que las condiciones sean perfectas antes de emitir actualizaciones, incluida una mejor comunicación con nuestros centros de datos. Además, cuando se realicen estas actualizaciones, nos aseguraremos de enviar correos electrónicos, notificaciones en todas nuestras cuentas de redes sociales, Discord y un sistema de notificación en el panel de control. Agradecemos enormemente a todos los que se quedaron con nosotros durante esto y su increíble paciencia mientras trabajábamos para resolverlo. Realmente lamentamos el tiempo de inactividad que todos ustedes experimentaron y les aseguraremos que continuaremos esforzándonos por seguir siendo la mejor empresa de alojamiento de servidores de Minecraft en el mundo.
Gracias,
Alojamiento Apex