CIO
Inteligencia artificial
IA
Gartner
Ciso

Tres áreas en las que AIops sobresale y dos en las que aún se queda corto

AIops acelera el descubrimiento y la resolución de problemas de TI, pero no es la panacea. Y el personal de operaciones aún debe preparar los datos para el aprendizaje automático y resolver manualmente algunos problemas.

AIops

La Inteligencia Artificial (IA) y el aprendizaje automático pueden reducir el número de falsas alertas que atan al personal de operaciones, acelerar la resolución de problemas y ayudar a los desarrolladores y arquitectos a entender y gestionar los entornos de TI basados en la nube, que cambian rápidamente.

Pero los CIO no deben esperar lo que algunos clientes llaman resultados "mágicos", como predecir y solucionar automáticamente cualquier problema informático concebible, o incluso aceptar cualquier registro o vapor de eventos y analizarlo sin ninguna limpieza o normalización de datos.

AIops es el uso de la Inteligencia Artificial para gestionar, optimizar y asegurar los sistemas de TI de forma más rápida, eficiente y eficaz que con los procesos manuales. Gartner estima que el mercado de AIops osciló entre 900 y 1.500 millones de dólares en 2020, con una tasa de crecimiento anual compuesta de alrededor del 15% entre 2020 y 2025. Además de las plataformas independientes de AIops, muchas herramientas de observabilidad, gestión y supervisión de TI se integran con las plataformas de AIops o han añadido capacidades de IA a sus productos.

Según clientes y analistas, AIops es la mejor para escanear rápidamente cantidades masivas de datos procedentes de cientos o miles de fuentes para filtrar las alertas más importantes o identificar las tendencias subyacentes, así como para detectar rápidamente nuevos elementos como las interfaces de programación de aplicaciones (API) que enlazan las aplicaciones, esas "cosas que la inteligencia humana ya no puede manejar", reconoce Sean Mack, CIO y CISO de Wiley, líder mundial en investigación y educación. Es ideal, dice, para proporcionar una visión de los problemas de TI entre "el crecimiento exponencial de la complejidad de nuestros sistemas y servicios", con elementos virtualizados que "pueden estar ahí un segundo y pueden no estarlo otro".

Pero los esfuerzos de AIops pueden fracasar si las empresas no comprenden sus límites.

 

Dónde sobresale AIops

Identificación de patrones. Un uso común y exitoso de AIops es reducir el "ruido" de las alertas que, bien duplican otras alertas, reflejan cambios normales en la infraestructura de TI, bien no afectan a los procesos críticos del negocio.

El análisis inteligente de los datos operativos puede identificar patrones comunes, como un aumento del tráfico a primera hora del día cuando los usuarios se conectan o durante los cierres financieros trimestrales, para entender qué patrones son normales y cuáles podrían ser señal de problemas, dice Stephen Elliot, vicepresidente de IDC. También puede identificar problemas recurrentes, como servidores sobrecargados, para ayudar al personal de operaciones a aplicar una solución antes de que los problemas afecten a los usuarios. La correlación de múltiples alertas con un único problema subyacente también puede reducir la carga del personal de operaciones y acelerar el análisis de la causa raíz de los problemas, afirma. 

Aunque se encuentra "en las primeras etapas de [su] viaje de AIops" utilizando la plataforma de observabilidad de New Relic, el distribuidor farmacéutico AmerisourceBergen ha visto una reducción de dos tercios en las alertas que no necesitan acción, lo que permite a sus ingenieros centrarse en los problemas importantes, priorizar mejor los incidentes, acelerar el análisis de la causa raíz y aumentar la disponibilidad de la aplicación, dice el vicepresidente de operaciones de TI Paul Stuart.  En Wiley, el personal de Mack utilizó las capacidades de AIops de Dynatrace para reducir el número de falsos positivos en más del 50%. Cuando se producen problemas, Wiley ha reducido el tiempo medio de resolución en más de un 37 por ciento, lo que Mack considera "una mejora enorme, enorme". Todo esto permite a su equipo, reconoce, dedicar más tiempo a mejorar la experiencia del cliente y ofrecer nuevos servicios innovadores.

Supervisión y seguimiento. AIops también puede facilitar al personal de operaciones el seguimiento de los cambios en su entorno informático, la supervisión de su rendimiento y la gestión rentable de entornos más grandes. "Actualmente estamos en medio de una gran adquisición", dice Stuart. "Al aprovechar AIops, podemos asumir la carga de monitorización adicional sin un aumento sustancial de la plantilla".

El proveedor de aparcamientos en aeropuertos Park 'N Fly utiliza la plataforma AIops de Dynatrace para supervisar su propia infraestructura de TI, así como las API que proporcionan información de los socios, como las que permiten a los clientes rastrear la ubicación de sus autobuses lanzadera y comprar el mantenimiento de sus vehículos mientras están de viaje, dice el director senior de TI Ken Schirrmacher. Dynatrace también descubre automáticamente nuevos componentes, como los servidores que Park 'N Fly aloja en la nube, "analiza su comportamiento, como los datos a los que accede y las otras aplicaciones a las que envía esos datos", creando una topología web que rastrea cómo se integran los componentes de su infraestructura informática, afirma.

Uno de los usos de AIops en Wiley es la gestión de los registros de eventos, no sólo para observar, sino para comprender las razones de la disponibilidad y fiabilidad de sus sistemas, dice Mack. "La monitorización ha pasado de moda", afirma. Lo que necesita es "observabilidad, es decir, la capacidad de hacer preguntas y obtener respuestas". La monitorización puede mostrarte la latencia (de los sistemas) cada segundo, pero la pregunta que quiero hacer es: "¿Por qué un usuario de Tombuctú tiene un problema?".

Llegar a las causas de raíz. AIops también es útil para acelerar el análisis de la causa raíz de los problemas, ayudando a determinar "en qué capa del mapa de servicios existe (el problema): en el navegador, en la base de datos, en el código (o) es un problema de la red local", admite Elliott. Wiley correlaciona los datos de todas las capas de la pila de aplicaciones, incluido el rendimiento de la base de datos y de las aplicaciones y la forma en que los usuarios experimentan sus aplicaciones y servicios, y ha utilizado Dynatrace y otras herramientas para reducir en un 40% el tiempo medio de resolución de problemas. "Esto supone una importante mejora del rendimiento para nuestros clientes", afirma.

Varios clientes advirtieron que AIops requiere configuración y a menudo no produce reducciones de costes a corto plazo. "Durante la fase de implementación, no se verá un ahorro inicial", dice Schirrmacher. "El beneficio se produce en gran medida en el futuro, cuando se necesitan menos empleados para gestionar el entorno en crecimiento, para que funcione de forma óptima, ya no es necesario programar al personal para las actualizaciones nocturnas o para resolver las interrupciones, o para programar las actualizaciones durante las vacaciones".

 

Dónde se queda corto AIops

Enfrentarse a las deficiencias de los datos. Cuantos más datos, y de mayor calidad, tenga un algoritmo de aprendizaje automático, mejor podrá comprender y analizar el funcionamiento de una infraestructura informática compleja. La falta de estos datos, o los límites de los datos que una plataforma AIops puede aprovechar, pueden limitar la eficacia de AIops, lo que hace que la gestión adecuada de los datos sea un elemento crucial para el éxito de AIops.

Nuestros primeros esfuerzos en materia de AIops tuvieron dificultades porque los proveedores no podían cumplir su promesa de aceptar nuestros datos "desordenados" y utilizarlos para identificar anomalías y problemas dentro de la infraestructura de TI", afirma el jefe de fiabilidad y observabilidad de servicios de Danske Bank, Vilius Ellikas. Danske Bank "ve un gran potencial" en su uso de la plataforma de observabilidad StackState para agregar, correlacionar y etiquetar automáticamente los datos de manera que nuestros sistemas puedan ver qué componentes de la infraestructura soportan qué aplicaciones y servicios", afirma. Esto ayuda al banco a "obtener lo básico antes de llegar a la magia del aprendizaje automático".

Notified, que utiliza una infraestructura basada en la nube para proporcionar comunicación y alojamiento para eventos y comunicaciones corporativas, está ejecutando su primera prueba de concepto de AIops utilizando las capacidades de AIops en Splunk y New Relic, dice el CTO Thomas Squeo. Mientras que AIops es útil para acelerar el análisis de la causa raíz y la agregación de eventos, dice, Notified todavía está agregando los datos históricos de rendimiento necesarios para predecir la cantidad de recursos en la nube que necesita para eventos a gran escala, como las conferencias de relaciones con los inversores.

Consolidar los datos operativos necesarios sobre su infraestructura era importante para AmerisourceBergen. "Uno de nuestros principales puntos débiles era tener entornos aislados que miraban su conjunto de herramientas y áreas que soportaban en lugar de la visión general", dice Stuart. "Ahora que tenemos todos los datos localizados de forma centralizada, nuestro motor AIops puede correlacionar las alertas de diferentes fuentes, permitiendo a los miembros del equipo de AmerisourceBergen centrarse rápidamente en el problema principal". Al correlacionar todos los datos en una sola ubicación, podemos empezar a identificar patrones que son señales de alerta temprana de que se están gestando problemas."

Corrección automatizada. La reparación totalmente automatizada de los problemas de seguridad, rendimiento u otros es otra área en la que AIops puede no cumplir las promesas del proveedor. "AIops se queda dramáticamente corto si los clientes quieren una 'caja mágica' que pueda encontrar instantánea y continuamente los problemas y sugerir el remedio ideal para ellos", admite el director de investigación senior de Gartner, Gregory Murray.

Algunos riesgos, como la explotación de una vulnerabilidad de seguridad previamente desconocida, son difíciles o imposibles de predecir, afirma. "También es imposible para cualquier sistema de IA evaluar todas las combinaciones de cambios en la infraestructura de TI y predecir de forma fiable el efecto de esos cambios".  

"Algunas organizaciones de TI están comenzando a desmenuzar lo que se sienten cómodas arreglando por sí solas", reconoce Elliott. "En algunos casos, se trata de la irrupción de nuevos servicios o nueva infraestructura" para evitar la degradación del rendimiento cuando las cargas de transacciones o las necesidades se disparan, mientras que en otros puede ser mover automáticamente los servicios a una región de AWS diferente o a un conjunto diferente de recursos.

En la actualidad, Notified lleva a cabo una corrección automatizada en sólo el 20% o el 25% de la cartera de aplicaciones "sobre una base ajustada al riesgo", afirma Squeo.

 

Cambio de cultura en el futuro

Para algunos, AIops es menos una disciplina independiente que una herramienta más para la agilidad de los procesos de TI y de negocio. IDC lo llama "análisis de operaciones de TI", y en Notified, "no utilizamos el término AIops", dice Squeo. "Usamos el término devsecops, que supone la existencia de buenas prácticas de monitorización, notificación y eventos y el aprovechamiento de AIops como parte de la cooperación global entre desarrollo y operaciones y seguridad".

En Wiley, AIops forma parte de un movimiento más amplio para dar más responsabilidad sobre la calidad de las aplicaciones y los servicios a los equipos que los desarrollan. "Adoptamos un enfoque devops (para) nuestra fiabilidad y gestión", dice Mack. "En última instancia, la responsabilidad es (con) los equipos que construyen los sistemas", que son los que más se juegan por su rendimiento en producción.

Stuart predice que AIops acabará facilitando "un cambio cultural en todo el equipo, en el que la automatización se convierte en el centro de atención" en lugar de responder manualmente a los problemas a medida que se producen. "A medida que maduremos, la atención se centrará en ver el entorno desde una perspectiva de servicio que combinará los componentes de la aplicación y la infraestructura con los impulsores del negocio", concluye.



TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS