¿Por qué es importante la observabilidad en ‘DataOps’?

Porque construir canalizaciones de datos confiables es difícil, y el primer paso para convertirse en una organización basada en datos se basa en la capacidad de poder confiar en los mismos.

La observabilidad de dataOps ayuda a abordar la fiabilidad

La observabilidad es una práctica empleada por los equipos de DevOps para permitir el rastreo a través de viajes de clientes, aplicaciones, microservicios y funciones de bases de datos. Las prácticas incluyen la centralización de los archivos de registro de aplicaciones, la supervisión del rendimiento de las aplicaciones y el uso de plataformas AIops para correlacionar las alertas en incidentes gestionables. El objetivo es crear visibilidad, resolver incidentes más rápidamente, realizar análisis de causa raíz, identificar tendencias de rendimiento, permitir análisis forenses de seguridad y resolver defectos de producción. En este sentido la observabilidad de DataOps persigue objetivos similares, sólo que estas herramientas analizan canalizaciones de datos, garantizan entregas de datos fiables y ayudan a resolver problemas de calidad de datos.

Lior Gavish, cofundador y director de tecnología de Monte Carlo, afirma: "La observabilidad de datos se refiere a la capacidad de una organización para comprender la salud de sus datos en cada etapa del ciclo de vida de DataOps, desde la ingestión en el almacén o lago hasta la capa de inteligencia empresarial, donde la mayoría de los problemas de calidad de datos salen a la luz para las partes interesadas".

Sean Knapp, CEO y fundador de Ascend.io, profundiza en el planteamiento del problema de dataOps. "La observabilidad debe ayudar a identificar factores críticos como el estado operativo en tiempo real de las canalizaciones y las tendencias en la forma de los datos", afirma. "Los retrasos y errores deben identificarse con antelación para garantizar una entrega de datos fluida dentro de los niveles de servicio acordados. Las empresas deben estar al tanto de las roturas de código de las canalizaciones y de los problemas de calidad de los datos para poder abordarlos rápidamente y evitar que se propaguen a los consumidores posteriores”.

Knapp destaca a los empresarios como clientes clave de las canalizaciones de DataOps. Muchas empresas se esfuerzan por convertirse en organizaciones orientadas a los datos, por lo que cuando los conductos de datos no son fiables o no se puede confiar en ellos, los líderes, los empleados y los clientes se ven afectados. Las herramientas para la observabilidad de DataOps pueden ser críticas para estas organizaciones, especialmente cuando los científicos de datos ciudadanos utilizan herramientas de visualización y preparación de datos como parte de su trabajo diario. Por su parte Chris Cooney, defensor de los desarrolladores en Coralogix, defiende que “la observabilidad es más que unos cuantos gráficos representados en un panel de control. Es una práctica de ingeniería que abarca toda la pila y permite a los equipos tomar mejores decisiones".

DataOps vs. DevOps

Es habitual que los equipos de DevOps utilicen varias herramientas de supervisión para cubrir la infraestructura, las redes, las aplicaciones, los servicios y las bases de datos. Es similar a DataOps: mismas motivaciones, diferentes herramientas. Eduardo Silva, fundador y CEO de Calyptia, confiesa que "es necesario disponer de sistemas que ayuden a dar sentido a esos datos, y ninguna herramienta será suficiente por sí sola. En consecuencia, hay que asegurarse de que las canalizaciones puedan dirigir los datos a una amplia variedad de destinos". Silva recomienda para ello soluciones de código abierto y neutrales. Merece la pena considerar este enfoque, sobre todo porque la mayoría de las organizaciones utilizan varios lagos de datos, bases de datos y plataformas de integración de datos. Una capacidad de observabilidad de DataOps integrada en una de estas plataformas de datos puede ser fácil de configurar e implantar, pero puede no proporcionar capacidades holísticas de observabilidad de datos que funcionen en todas las plataformas.

¿Qué capacidades se necesitan por tanto? Ashwin Rajeev, cofundador y director de Tecnología de Acceldata.io, cree firmemente que “la observabilidad de los datos empresariales debe ayudar a superar los cuellos de botella asociados a la creación y el funcionamiento de canalizaciones de datos fiables". Rajeev profundiza: "Los datos deben entregarse de manera eficiente a tiempo en todo momento mediante el uso de la instrumentación adecuada con API y SDK. Las herramientas deben tener una navegación y un desglose adecuados que permitan realizar comparaciones. Debe ayudar a los equipos de DataOps a identificar rápidamente los cuellos de botella y las tendencias para una solución de problemas más rápida y un ajuste del rendimiento para predecir y prevenir incidentes”.

Capacidades de código y low-code

Un aspecto de la observabilidad de los DataOps son las operaciones, es decir, la fiabilidad y puntualidad de la entrega desde la fuente hasta la plataforma de gestión de datos y el consumo. Una segunda preocupación es la calidad de los datos. Armon Petrossian, cofundador y consejero delegado de Coalesce, habla sobre ello. "La observabilidad de los datos en DataOps implica garantizar que los equipos empresariales y de ingeniería tengan acceso a datos correctamente limpiados, gestionados y transformados para que las organizaciones puedan tomar decisiones técnicas y empresariales basadas en los mismos. Con la evolución actual de las aplicaciones de datos, para preparar mejor las canalizaciones de datos, las organizaciones deben centrarse en herramientas que ofrezcan la flexibilidad de un enfoque basado primero en el código, pero que estén basadas en GUI para permitir la escala empresarial, porque, al fin y al cabo, no todo el mundo es ingeniero de software".

Así pues, los DataOps y, por tanto, la observabilidad de los datos, deben tener capacidades que atraigan a los programadores que consumen API y desarrollan canalizaciones de datos sólidas y en tiempo real. Pero los no programadores también necesitan herramientas de calidad de datos y resolución de problemas para trabajar con sus esfuerzos de preparación y visualización de datos. "Del mismo modo que DevOps se basa en gran medida en herramientas de automatización de bajo código, DataOps también lo hace", añade Gavish. "Como componente crítico del ciclo de vida de DataOps, las soluciones de observabilidad de datos deben ser fáciles de implementar y desplegar en múltiples entornos de datos".

Supervisión de canalizaciones de datos distribuidas

Para muchas grandes empresas no es fácil implantar aplicaciones y canalizaciones de datos fiables. "Incluso con la ayuda de estas plataformas de observabilidad, los equipos de las grandes empresas tienen dificultades para anticiparse a muchos incidentes", afirma Srikanth Karra, CHRO de Mphasis. "Un problema clave es que los datos no proporcionan una visión adecuada de las transacciones que fluyen a través de múltiples nubes y entornos heredados". Hillary Ashton, directora de producto de Teradata, está de acuerdo. "Los ecosistemas de datos modernos están inherentemente distribuidos, lo que crea la difícil tarea de gestionar la salud de los datos a lo largo de todo el ciclo de vida". Además, comparte la siguiente conclusión: "Si no puedes confiar en tus datos, nunca te convertirás en data driven".

Así, Ashton recomienda para lograr una canalización de datos altamente fiable, “las empresas apuesten por una visión de 360 grados que integre los metadatos operativos, técnicos y empresariales mediante la observación de los datos de telemetría. Esta visión permite identificar y corregir problemas como la frescura de los datos, los registros que faltan, los cambios en los esquemas y los errores desconocidos. Integrar el aprendizaje automático en el proceso también puede ayudar a automatizar estas tareas".

Hemos recorrido un largo camino desde que utilizábamos comandos Unix para analizar archivos de registro en busca de problemas de integración de datos. Las herramientas actuales de observabilidad de datos son mucho más sofisticadas, pero proporcionar a la empresa canalizaciones de datos fiables y un procesamiento de datos de alta calidad sigue siendo un reto para muchas organizaciones. Acepte el reto y asóciese con los líderes empresariales en una implementación ágil e incremental, porque las visualizaciones de datos y los modelos de machine learning construidos sobre datos poco fiables pueden conducir a decisiones erróneas y potencialmente perjudiciales.

Imprimir Subir

TE PUEDE INTERESAR...

Entrevistas

La innovación alcanza velocidad de crucero en el vigésimo aniversario de Vueling

Liderazgo & Gestión TI

La IA, a punto de ocupar los puestos de trabajo que requieren menos experiencia en las grandes compañías financieras

Banca y seguros

Revolut inaugura en la Ciudad Condal un ‘hub’ tecnológico

Industria y Utilities

La Autoridad Portuaria de Baleares unifica sus sistemas TIC

Industria y Utilities

Toyota optimiza sus procesos en Europa para mejorar el ‘time to market’

Sanidad

El Hospital Ribera Polusa trata las fobias con su propio sistema de realidad virtual

Tendencias

6 tendencias que definen el mercado de TI empresarial actual

Retail

Fluidra traslada su gestión a la nube con RISE with SAP

Sanidad

"Ya nadie se plantearía montar un hospital comprando servidores"

Entrevistas

Empath-IA, una nueva forma de abordar la gestión de recursos humanos

Tendencias

La analítica deportiva aprovecha la IA y el ML para mejorar el juego

Liderazgo & Gestión TI

La ESA estudia el ámbito urbano mediante un nuevo algoritmo de IA

Liderazgo & Gestión TI

RTVE adjudica a Colt la implementación de la red del sistema de contribución

Transporte & Logística

El embarque por reconocimiento facial ya es una realidad en la ruta Madrid-Barcelona de Iberia

Parque Doñana - red comunicaciones digitales radioenlace

Liderazgo & Gestión TI

La Estación Biológica de Doñana estrena una red digital de comunicaciones

Sanidad

IA generativa para mejorar la salud pública; el reto de la OMS

A FONDO

La división española de Thales Alenia Space, al mando de las comunicaciones en la misión NEO Surveyor de la NASA

Visión tecnológica 2024: perspectivas de los CIO ante la revolución digital

Tecnología e innovación, el Olimpo del turismo

Los principales desafíos que enfrentarán los CIO en 2024

2023: un viaje tecnológico marcado por la resiliencia empresarial y la innovación

CASOS DE ÉXITO

Empath-IA, una nueva forma de abordar la gestión de recursos humanos

10 ABR 2024

Nuria Fuentes, CIO y líder de Sistemas y Transformación Digital en Ingesan, descifra la apuesta de la compañía por implementar IA en sus procedimientos en el ámbito de los RR.HH.

Miele abraza la transformación digital con el fin de aportar valor a empleados, colaboradores y clientes

26 MAR 2024

Agustín Perales, IT infrastructure manager en Miele Iberia

La compañía se encuentra inmersa en la migración de su solución global de contact center con el fin de conseguir mayor flexibilidad a la hora de atender a sus clientes.

Accede a nuestra publicación de canal

Documentos ComputerWorld

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

15 ABR 2024

La volatilidad ha venido para quedarse y las compañías tienen que adaptarse a gran velocidad, con infraestructuras tecnológicas que sean capaces de responder al mismo ritmo. En este contexto, el viaje hacia los modelos como servicio es una tendencia imparable que, junto con sus múltiples beneficios, también presenta retos. Descubre en este documento las principales conclusiones del debate.

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

12 FEB 2024

Para muchas organizaciones, la red empresarial es el eslabón más débil en su cadena de infraestructura. Por eso, las empresas deberán tener una red moderna, ágil yresiliente. Averigua en este libro electrónico a qué desafíos de red se enfrentan las compañías y cómo abordarlos.

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

15 ENE 2024

La capacidad de adaptarse y evolucionar rápidamente es esencial para el éxito de cualquier empresa y, en este contexto, la elección de una infraestructura tecnológica sólida es vital. SAP S/4HANA Cloud, Public Edition emerge como una opción revolucionaria para impulsar la eficiencia operativa y la innovación empresarial.