Cloud Computing
CIO

Lo que los CIO pueden aprender de las interrupciones de servicios de TI

El impacto de las interrupciones del sistema saca a la luz la cruda realidad de que a medida que la nube continúa evolucionando, existen serios desafíos para su verdadera capacidad de recuperación para resistir los errores.

Cloud computing

Las interrupciones de organizaciones en los sectores financiero, gubernamental, de viajes y de telecomunicaciones parecen ocurrir semanalmente, a menudo causadas por fallos de hardware, actualizaciones de software, errores humanos y ataques de ransomware, lo que causa una interrupción importante del servicio.

El impacto de estos cortes de luz saca a la luz la cruda realidad de que a medida que la nube continúa evolucionando, existen serios desafíos para su verdadera capacidad de resistencia para resistir los errores no forzados.

Desde el daño a la reputación hasta la pérdida de ingresos, la pérdida de productividad u otras medidas, una cosa es cierta: ninguna empresa puede permitirse una interrupción en el entorno empresarial ultracompetitivo actual. Nunca ha habido un mejor momento para que los CIO vean con frialdad sus planes de continuidad del negocio y recuperación ante desastres (DR) para ver si están realmente preparados.

El hecho es que el coste de invertir en una plataforma de recuperación ante desastres (DR) verdaderamente resistente es exponencialmente menor que el coste de tener que arreglar la situación después del hecho. Para hacer esto, cada vez más CIO están viendo el verdadero valor de tener un enfoque en capas para su estrategia en la nube, es decir, un centro de datos secundario (o más), geográficamente y meteorológicamente, de recuperación de datos fuera de las instalaciones. Esto garantiza que, en caso de que algo suceda en su sitio principal, siempre tendrá una ubicación secundaria para evitar o reducir el impacto de una interrupción.

El coste del tiempo de inactividad

En un mundo en el que confiamos cada vez más en las capacidades de TI, muchas de ellas soportadas en la nube, algunas empresas son increíblemente vulnerables a cualquier tiempo de inactividad, y pueden encontrarse con todo su sitio web, y consecuentemente con su negocio, fuera de línea por una cantidad significativa de hora.

Algunas aplicaciones empresariales serán las más difíciles de tener, ya que están diseñadas en el lugar y no están diseñadas para la portabilidad. Para resolver este desafío, y tener las redes de seguridad adecuadas, muchos CIO ahora están buscando cómo construir una nube más híbrida, aprovechando un proveedor de servicios administrados o sus propios centros de datos.

El tiempo de inactividad puede tener consecuencias desastrosas para una empresa, tanto desde el punto de vista financiero como de reputación. De hecho, Gartner estima que, en promedio, cada minuto de tiempo de inactividad costará a una empresa 5,600 dólares, lo que suma más de 300.000 dólares por hora.

La diversidad se suma al efecto de resiliencia en capas

Tener un plan DR solo no es suficiente. Nuevamente, la resiliencia en capas es clave aquí en lo que respecta a la continuidad del negocio. Esto significa examinar sus proveedores, ubicaciones y tecnologías para comprender cómo hacer que todo esto sea heterogéneo.

Tener diversidad se suma al efecto de resiliencia en capas al separar una acción, actividad, error o evento catastrófico del impacto en el resto del entorno empresarial. Y debe probar ese plan regularmente, para asegurarse de que, si recibe un golpe, evite el tiempo de inactividad al incorporar los músculos de automatización en su plan.

Una infraestructura de DR exitosa necesita ser altamente automatizada y replicar continuamente los datos, permitiendo que las aplicaciones se "rebobinen" rápidamente a los segundos justo antes de una interrupción. Debe poder cumplir con el objetivo de punto de recuperación (RPO) definido por la empresa, con poca o ninguna pérdida de datos o pérdida de disponibilidad de la aplicación. Incluso unos pocos segundos le pueden costar decenas de miles de dólares, ya sea por la pérdida de ingresos de una aplicación que está inactiva y no puede realizar transacciones o incurrir en multas por incumplimiento de la normativa.

Resistencia de TI: el caso de la nube híbrida

Cada CIO tiene sus propios requisitos organizativos. Algunos tienen problemas de cumplimiento y otros pueden tener problemas de ubicación de datos. Por esta razón, los planes de DR a veces pueden parecer tan únicos como una huella digital en la forma en que se crean, se mantienen y dónde se recuperan también. Si bien las TI se están moviendo claramente hacia las infraestructuras basadas en la nube, la pieza central de esta tendencia gira en torno a la capacidad de prosperar a través de cada permutación de un desastre que sea más que causas naturales, pero incluso fallas de energía y errores humanos comunes.

Aunque cada elemento dentro de la nube híbrida tiene sus propias fortalezas y debilidades asociadas, ¿cuál es la mejor forma de gestionar las interrupciones del servicio de tecnología?

Estos son los tres pilares que ayudan a las organizaciones de clase empresarial a lograr la capacidad de recuperación de TI:

1. Debe tener resiliencia en capas, es decir, un centro de datos de recuperación secundario (o más), geográficamente y meteorológicamente diverso. Esto garantiza que, en caso de que algo suceda en su sitio principal, siempre tendrá la ubicación redundante para reducir por completo el riesgo de una interrupción prolongada.

Use un proveedor de servicios gestionados (MSP) o un proveedor de servicios en la nube (CSP). Use un proveedor de servicios gestionados (MSP) o un proveedor de servicios en la nube (CSP). Esto cambia el modelo financiero a OpEx y le permite aprovechar una infraestructura preparada y proveedores contratados de proveedores de servicios contratados contractualmente para cumplir con el acuerdo de nivel de servicio (SLA) definido.

2. Contar con una infraestructura de nube pública. Cada vez más, las organizaciones están lanzando sus propios acuerdos o aprovechando socios de MSP / CSP para "probar" la nube pública como segundo o tercer sitio. Las empresas deben comprender y hacer coincidir sus datos y la prioridad de la aplicación con los objetivos y requisitos de SLA asociados.

3. Si bien cada interrupción de la nube pública demuestra que no es inmune a las catástrofes, considerar la nube pública como parte de su capacidad de recuperación en capas, un plan híbrido puede ser una forma rentable de obtener un tercer sitio o más y agregar algo de diversidad geo y meteorológica para su plan.



TE PUEDE INTERESAR...

Nuevo número de nuestra revista de canal 
 
DealerWorld Digital

 

Cobertura de nuestros encuentros

 

Documentos ComputerWorld



Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?