Inteligencia artificial
Machine learning
Analítica de datos

Cómo explicar a los ejecutivos el ciclo de vida del aprendizaje automático

Para que los equipos de ciencia de datos tengan éxito, los líderes empresariales deben comprender la importancia de MLops, modelops y el ciclo de vida del aprendizaje automático. Prueba estas analogías y ejemplos para romper con la jerga.

interrogante

Si eres científico de datos o trabajas con modelos de aprendizaje automático (ML), tienes herramientas para etiquetar datos, entornos tecnológicos para entrenar modelos y una comprensión fundamental de MLops y modelops. Si tiene modelos de ML ejecutándose en producción, probablemente utilices la supervisión de ML para identificar la desviación de datos y otros riesgos del modelo.

Los equipos de ciencia de datos utilizan estas prácticas y plataformas esenciales de ML para colaborar en el desarrollo de modelos, configurar la infraestructura, desplegar modelos de ML en diferentes entornos y mantener modelos a escala. Otros que buscan aumentar el número de modelos en producción, mejorar la calidad de las predicciones y reducir los costes de mantenimiento de los modelos de ML probablemente también necesiten estas herramientas de gestión del ciclo de vida de ML.

Por desgracia, no es fácil explicar estas prácticas y herramientas a las partes interesadas de la empresa y a los responsables de la toma de decisiones presupuestarias. Esto se debe a que es jerga técnica para unos líderes que quieren entender el retorno de la inversión y el impacto empresarial de las inversiones en aprendizaje automático e inteligencia artificial y que preferirían mantenerse al margen de los entresijos técnicos y operativos.

 

¿Qué es el ciclo de vida del aprendizaje automático?

Como desarrollador o científico de datos dispones de un proceso de ingeniería para llevar las nuevas ideas desde el concepto hasta la entrega de valor empresarial. Ese proceso incluye definir el planteamiento del problema, desarrollar y probar modelos, desplegar modelos en entornos de producción, supervisar modelos en producción y permitir el mantenimiento y las mejoras. Llamamos a esto un proceso de ciclo de vida, sabiendo que el despliegue es el primer paso para hacer realidad el valor empresarial y que, una vez en producción, los modelos no son estáticos y requerirán un apoyo continuo.

Es posible que los líderes empresariales no entiendan el término ciclo de vida. Muchos todavía perciben el desarrollo de software y el trabajo de la ciencia de datos como inversiones de una sola vez, que es una de las razones por las que muchas organizaciones sufren de deuda tecnológica y problemas de calidad de datos. Explicar el ciclo de vida con términos técnicos sobre desarrollo de modelos, formación, despliegue y supervisión hará que a un ejecutivo le hagan los ojos chiribitas. Marcus Merrell, vicepresidente de Estrategia tecnológica de Sauce Labs, sugiere ofrecer a los directivos una analogía del mundo real.

"El aprendizaje automático es en cierto modo análogo a la agricultura: Los cultivos que conocemos hoy son el resultado ideal de generaciones anteriores que notaron patrones, experimentaron con combinaciones y compartieron información con otros agricultores para crear mejores variaciones utilizando el conocimiento acumulado", dice. "El aprendizaje automático es en gran medida el mismo proceso de observación, conclusiones en cascada y conocimiento compuesto a medida que su algoritmo se entrena".

Lo que me gusta de esta analogía es que ilustra el aprendizaje generativo de un año de cultivo al siguiente, pero también puede tener en cuenta los ajustes en tiempo real que pueden producirse durante una temporada de cultivo debido al clima, la cadena de suministro u otros factores. En la medida de lo posible, puede ser beneficioso encontrar analogías en su sector o en un ámbito que entiendan sus directivos.

 

¿Qué es MLops?

La mayoría de los desarrolladores y científicos de datos piensan en MLops como el equivalente de DevOps para el aprendizaje automático. La automatización de la infraestructura, la implementación y otros procesos de ingeniería mejora la colaboración y ayuda a los equipos a centrar más energía en los objetivos empresariales en lugar de realizar tareas técnicas manualmente. Pero todo esto está en la maleza para los ejecutivos de negocios que necesitan una definición simple de MLops, especialmente cuando los equipos necesitan presupuesto para herramientas o tiempo para establecer mejores prácticas.

"MLops, u operaciones de aprendizaje automático, es la práctica de colaboración y comunicación entre la ciencia de datos, TI y el negocio para ayudar a gestionar el ciclo de vida de extremo a extremo de los proyectos de aprendizaje automático", dice Alon Gubkin, CTO y cofundador de Aporia. "MLops consiste en reunir a diferentes equipos y departamentos dentro de una organización para garantizar que los modelos de aprendizaje automático se desplieguen y mantengan de manera efectiva”.

Thibaut Gourdel, director de Marketing de productos técnicos de Talend, sugiere añadir algún detalle para los líderes empresariales más orientados a los datos. Según él, "MLops promueve el uso de principios de software ágiles aplicados a proyectos de ML, como el control de versiones de datos y modelos, así como la validación continua de datos, las pruebas y el despliegue de ML para mejorar la repetitividad y la fiabilidad de los modelos, además de la productividad de sus equipos”.

 

¿Qué es la desviación de datos?

Siempre que se puedan utilizar palabras que transmitan una imagen, es mucho más fácil relacionar el término con un ejemplo o una historia. Un ejecutivo entiende lo que es la deriva a partir de ejemplos como el de un barco que se desvía de su rumbo a causa del viento, pero puede que le cueste trasladarlo al mundo de los datos, las distribuciones estadísticas y la precisión de los modelos. "La deriva de los datos se produce cuando los datos que el modelo ve en producción ya no se parecen a los datos históricos con los que fue entrenado", comenta Krishnaram Kenthapadi, director de IA y científico de Fiddler AI. "Puede ser brusco, como los cambios en el comportamiento de compra provocados por la pandemia. Independientemente de cómo se produzca la deriva, es fundamental identificar estos cambios rápidamente para mantener la precisión del modelo y reducir el impacto en el negocio”.

Gubkin proporciona un segundo ejemplo de cuando la desviación de datos es un cambio más gradual de los datos con los que se entrenó el modelo. "La deriva de datos es como si los productos de una empresa se volvieran menos populares con el tiempo porque las preferencias de los consumidores han cambiado". David Talby, CTO de John Snow Labs, compartió una analogía generalizada. "La deriva del modelo se produce cuando la precisión se degrada debido al entorno de producción cambiante en el que opera", afirma. "Al igual que el valor de un coche nuevo disminuye en el momento en que lo sacas del concesionario, un modelo hace lo mismo, ya que el entorno de investigación predecible en el que fue entrenado se comporta de manera diferente en la producción. Independientemente de lo bien que funcione, un modelo siempre necesitará mantenimiento, ya que el mundo que lo rodea cambia”.

El mensaje importante que deben transmitir los responsables de la ciencia de datos es que, dado que los datos no son estáticos, hay que revisar la precisión de los modelos y volver a entrenarlos con datos más recientes y relevantes.

 

¿Qué es la supervisión del ML?

¿Cómo mide un fabricante la calidad antes de que sus productos se empaqueten y envíen a minoristas y clientes? Los fabricantes utilizan diferentes herramientas para identificar defectos, incluido el momento en que una línea de montaje empieza a mostrar desviaciones respecto a la calidad aceptable de la producción. Si pensamos en un modelo de ML como una pequeña planta de fabricación que produce previsiones, entonces tiene sentido que los equipos de ciencia de datos necesiten herramientas de supervisión de ML para comprobar si hay problemas de rendimiento y calidad. Katie Roberts, arquitecta de soluciones de ciencia de datos en Neo4j, afirma: "La supervisión de ML es un conjunto de técnicas que se utilizan durante la producción para detectar problemas que pueden afectar negativamente al rendimiento del modelo, dando lugar a perspectivas de baja calidad”.

La fabricación y el control de calidad es una analogía fácil, y aquí hay dos recomendaciones. "A medida que las empresas aceleran la inversión en iniciativas de IA/ML, los modelos de IA aumentarán drásticamente de decenas a miles. Cada uno de ellos debe almacenarse de forma segura y supervisarse continuamente para garantizar su precisión", afirma Hillary Ashton, directora de Producto de Teradata.

 

¿Qué es modelops?

MLops se centra en equipos multidisciplinares que colaboran en el desarrollo, despliegue y mantenimiento de modelos. Pero, ¿cómo deben decidir los directivos en qué modelos invertir, cuáles requieren mantenimiento y dónde crear transparencia en torno a los costes y beneficios de la inteligencia artificial y el aprendizaje automático? Estas son preocupaciones de gobernanza y parte de lo que las prácticas y plataformas modelops pretenden abordar. Los directivos quieren modelops, pero no comprenderán plenamente la necesidad y lo que ofrece hasta que se aplique parcialmente.

Esto es un problema, especialmente para las empresas que desean invertir en este tipo de plataformas. Nitin Rakesh, consejero delegado y director general de Mphasis, sugiere explicar modelops de esta manera. "Al centrarse en modelops, las organizaciones pueden garantizar que los modelos de aprendizaje automático se desplieguen y mantengan para maximizar el valor y garantizar la gobernanza de las diferentes versiones". Ashton sugiere incluir un ejemplo de práctica. "Modelops permite a los científicos de datos identificar y remediar los riesgos de calidad de datos, detectar automáticamente cuando los modelos se degradan y programar el reentrenamiento del modelo", dice.

Todavía hay muchas nuevas capacidades, algoritmos y tecnologías de ML e IA con una jerga confusa que se filtrará en el vocabulario de un líder empresarial. Cuando los especialistas en datos y los tecnólogos dedican tiempo a explicar la terminología en un lenguaje comprensible para los directivos, es más probable que consigan el apoyo de la colaboración y la aceptación de las nuevas inversiones.



TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS