CLOUD | Noticias | 13 MAR 2012

Microsoft compensará a los afectados por el fallo de Azure

Microsoft ha confirmado que facilitará un crédito a los clientes afectados por los fallos de Azure. La compañía compensa así a los usuarios que sufrieron problemas con su servicio en la nube el pasado 29 de febrero.
Computerworld

La decisión de Microsoft de recompensar monetariamente a los usuarios de su servicio cloud proviene de la cadena de fallos y errores que acabaron con la caída de la mayor parte de las soluciones de la plataforma Azure. 
Una caída que se originó por lo que se podría considerar la evolución del “Efecto 2000” pero por culpa del año bisiesto. Dicho de otro modo: al iniciarse las máquinas virtuales, éstas generan un certificado que incluye la fecha y año en que se emite. Pero cuando los certificados se emitieron a las cuatro de la tarde del 28 de febrero, automáticamente se les dio una fecha válida para el 29 de febrero de 2013, que obviamente el sistema reconoció como no válido, provocando una serie de intentos de autenticación que también fracasaron y llevando finalmente al colapso. Los intentos automáticos de migrar las máquinas virtuales a más de 1.000 servidores físicos evitaron el desastre pero impidieron que el sistema estuviera disponible para los usuarios. Por el lado positivo, el sistema estaba programado para detener los intentos a la hora de reconocer los certificados y tratar de iniciar las máquinas, con lo que una vez alcanzado este umbral se detuvo la cadena y esto posibilitó que algunos servicios pudieran permanecer activos, aunque a un nivel reducido. 
Asimismo, Azure también cerró el servicio a la plataforma de gestión para que los clientes no pudieran agregar aplicaciones o ampliar la capacidad para ejecutar aplicaciones, ya que el problema empeoraba si se exigían nuevas máquinas virtuales. 
Micrososft AzureEn total fueron 13 horas y 23 minutos de caída del servicio hasta que Microsoft logró reparar el error.
Microsoft está tomando tres medidas para evitar un problema similar. En primer lugar, van a lanzar un programa de pruebas en busca de nuevas incompatibilidades de tiempo en su software. También cambiará su aislamiento de fallos para que el sistema no asuma un fallo de hardware en este tipo de circunstancias. Y en tercer lugar, se permitirá una ligera degradación de la gestión de clientes en lugar de apagar la plataforma por completo. Esto permitirá el bloqueo de nuevas máquinas virtuales o la ampliación de las antiguas, pero seguirá permitiendo la gestión de máquinas virtuales existentes.

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información