IA generativa: un cambio de paradigma en las oportunidades de las empresas y las ‘startups’

Comprender el papel que desempeñan las tecnologías subyacentes en el avance de la adopción y la innovación por parte de las empresas resulta crucial especialmente atendiendo a las tasas de impacto que registran.

Cómo hemos llegado hasta aquí

Las tecnologías facilitadoras más notables de la IA generativa son el aprendizaje profundo, las incrustaciones, el aprendizaje por transferencia (todas ellas surgidas a principios o mediados de la década de 2000) y los transformadores de redes neuronales (inventados en 2017). La capacidad de trabajar con estas tecnologías a una escala sin precedentes -tanto en términos del tamaño del modelo como de la cantidad de entrenamiento- es un fenómeno reciente y de importancia crítica.

El aprendizaje profundo surgió en el mundo académico a principios de la década de 2000, con una adopción más amplia en la industria a partir de 2010. Un subcampo del aprendizaje automático -el aprendizaje profundo- entrena modelos para diversas tareas presentándoles ejemplos. El aprendizaje profundo puede aplicarse a un tipo concreto de modelo denominado red neuronal artificial, que consta de capas de nodos informáticos simples interconectados denominados neuronas. Cada neurona procesa la información que le transmiten otras neuronas y luego transmite los resultados a las neuronas de las capas siguientes. Los parámetros de los modelos de redes neuronales se ajustan utilizando los ejemplos presentados al modelo en el entrenamiento. De este modo, el modelo puede predecir o clasificar datos nuevos que no se habían visto antes. Por ejemplo, si tenemos un modelo entrenado con miles de fotos de perros, ese modelo puede utilizarse para detectar perros en imágenes no vistas anteriormente.

Por otro lado, el aprendizaje por transferencia surgió a mediados de la década de 2000 y se popularizó rápidamente. Se trata de una técnica de aprendizaje automático que utiliza los conocimientos adquiridos en una tarea para mejorar el rendimiento del modelo en otra. Una analogía para entender esta potente técnica es aprender una de las "lenguas romances", como el español. Debido a sus similitudes, puede resultar más fácil aprender otra lengua románica, como el italiano. El aprendizaje por transferencia es esencial en la IA generativa porque permite que un modelo aproveche el conocimiento de una tarea en otra relacionada. Esta técnica ha demostrado ser innovadora, ya que mitiga el problema de la escasez de datos. El aprendizaje por transferencia también puede mejorar la diversidad y la calidad de los contenidos generados. Por ejemplo, un modelo pre-entrenado en un gran conjunto de datos de texto puede afinarse en un conjunto de datos más pequeño de texto específico de un determinado dominio o estilo. De este modo, el modelo puede generar un texto más coherente y pertinente para un determinado ámbito o estilo.

Otra técnica que se impuso entre principios y mediados de la década de 2000 fue la incrustación. Se trata de una forma de representar datos, con mayor frecuencia palabras, como vectores numéricos. Las tecnologías orientadas al consumidor, como ChatGPT, demuestran lo que parece una lógica humana y son un gran ejemplo del poder de las incrustaciones de palabras. Las incrustaciones de palabras están diseñadas para captar las relaciones semánticas y sintácticas entre las palabras. Por ejemplo, la representación en un espacio vectorial de las palabras ‘perro’ y ‘león’ estaría mucho más próxima entre sí que al espacio vectorial de ‘manzana’. La razón es que ‘perro’ y ‘león’ tienen considerables similitudes contextuales. En la IA generativa, esto permite a un modelo comprender las relaciones entre las palabras y su significado en el contexto, lo que hace posible que modelos como ChatGPT proporcionen un texto original contextualmente relevante y semánticamente preciso.

Las incrustaciones tuvieron un enorme éxito como representación del lenguaje e impulsaron la exploración de nuevas arquitecturas de redes neuronales más potentes. Una de las más importantes, el "transformador", se desarrolló en 2017. El transformador es una arquitectura de red neuronal diseñada para procesar datos de entrada secuenciales, como el lenguaje natural, y realizar tareas como el resumen o la traducción de textos. En particular, el transformador incorpora un mecanismo de autoatención. Esto permite al modelo centrarse en distintas partes de la secuencia de entrada según sea necesario para captar relaciones complejas entre palabras de forma sensible al contexto. Así, el modelo puede aprender a ponderar la importancia de cada parte de los datos de entrada de forma diferente para cada contexto. Por ejemplo, en la frase "el perro no saltó la valla porque estaba demasiado cansado", el modelo examina la frase para procesar cada palabra y su posición. A continuación, mediante la autoatención, el modelo evalúa las posiciones de las palabras para encontrar la asociación más cercana con ‘eso’. La autoatención se utiliza para generar una comprensión de todas las palabras de la frase en relación con la que estamos procesando en ese momento, ‘eso’. Por lo tanto, el modelo puede asociar la palabra ‘eso’ con la palabra ‘perro’ en lugar de con la palabra ‘valla’.

Los avances en las arquitecturas de aprendizaje profundo, la computación distribuida de manera eficiente y los algoritmos y metodologías de entrenamiento han hecho posible entrenar modelos más grandes. En el momento de escribir este artículo, el modelo más grande es ChatGPT3 de OpenAI, que consta de 173 mil millones de parámetros; la información de los parámetros de ChatGPT4 aún no está disponible. ChatGPT3 también es digno de mención porque ha absorbido las mayores cantidades de texto conocidas públicamente, 45 TB de datos, en forma de ejemplos de texto, todo el contenido textual de Internet y otras formas de expresión humana.

Aunque el uso combinado de técnicas como el aprendizaje por transferencia, la incrustación y los transformadores para la IA Generativa es evolutivo, el impacto en la forma en que se construyen los sistemas de IA y en la adopción por parte de la empresa es revolucionario. Como resultado, la carrera por el dominio de los modelos de base, como los populares modelos de lenguaje de gran tamaño (LLM), está en marcha con las empresas ya establecidas y las nuevas compitiendo por una posición en la que el ganador se lo lleva todo o la mayoría.

Aunque los requisitos de capital para los modelos básicos son elevados, lo que favorece a las grandes empresas tecnológicas tradicionales o a las nuevas empresas con una financiación muy elevada (miles de millones de dólares), las oportunidades de disrupción por parte de la IA Generativa son amplias y profundas en toda la empresa.

**Entendiendo el stack tecnológico**

Para aprovechar eficazmente el potencial de la IA generativa, las empresas y los emprendedores deben comprender cómo se clasifican sus capas tecnológicas y las implicaciones que cada una de ellas tiene en la creación de valor.

La forma más básica de entender las tecnologías en torno a la IA generativa es organizarlas en una pila tecnológica de tres capas. En la parte inferior de esta pila se encuentran los modelos básicos, que representan una ola transformadora en la tecnología análoga a la informática personal o la web. Esta capa estará dominada por operadores consolidados como Microsoft, Google y Meta, en lugar de nuevas empresas emergentes, lo que no difiere demasiado de lo que vimos con la revolución móvil o la computación en nube. Hay dos razones fundamentales para este fenómeno. En primer lugar, la escala a la que operan estas empresas y el tamaño de sus balances son bastante significativos. En segundo lugar, los operadores tradicionales actuales han acaparado los principales recursos que alimentan los modelos fundacionales: la informática y los datos.

En la parte superior de esta pila se encuentran las aplicaciones: software desarrollado para un caso de uso concreto diseñado para una tarea específica. A continuación está la capa intermedia. En ella, las tecnologías habilitadoras potencian las aplicaciones de la capa superior y amplían las capacidades de los modelos básicos. Por ejemplo, MosaicML permite a los usuarios crear su propia IA a partir de sus datos, convirtiéndolos en un modelo de IA a gran escala que ejecuta eficazmente cargas de trabajo de aprendizaje automático en cualquier nube de la infraestructura del usuario. Cabe destacar que en este debate falta una evaluación en profundidad de la capa intermedia. Hacer predicciones sobre esta parte de la pila en una fase tan temprana del ciclo entraña muchos riesgos. Mientras que las herramientas gratuitas de los operadores tradicionales que buscan impulsar la adopción de sus modelos básicos podrían llevar a una mercantilización de la capa intermedia, las herramientas de modelos multiplataforma o multifundamentales que ofrecen capacidades añadidas y optimizan los modelos que mejor se adaptan a un caso de uso podrían cambiar las reglas del juego.

A corto plazo, antes de que se desarrollen más los productos y plataformas de la capa intermedia, la capa de aplicación representa la mayor parte de las oportunidades para los inversores y creadores de IA generativa. Especialmente interesantes son los productos orientados al usuario que ejecutan sus propias canalizaciones de modelos, a menudo además de los modelos de fundaciones públicas. Se trata de aplicaciones integrales. Estas aplicaciones integradas verticalmente, desde el modelo hasta la capa de aplicación orientada al usuario, representan el mayor valor, ya que proporcionan una mayor defensa. El modelo propietario es valioso porque el reentrenamiento continuo de un modelo en datos de productos propietarios crea una mayor defensa y diferenciación. Sin embargo, esto tiene el coste de una mayor intensidad de capital y crea retos para que un equipo de producto se mantenga ágil.

Casos de uso en aplicaciones de IA generativa

La consideración adecuada de los casos de uso y las oportunidades a corto plazo de la capa de aplicación para la IA generativa requiere conocer el valor incremental de los datos o contenidos y una comprensión completa de las consecuencias de la precisión imperfecta. Por lo tanto, las oportunidades a corto plazo serán aquellas con un alto valor de datos o contenidos incrementales, donde más datos o contenidos tengan valor económico para el negocio y bajas consecuencias de precisión imperfecta. Otras consideraciones son la estructura de los datos para el entrenamiento y la generación y el papel del human-in-the-loop, un sistema de inteligencia artificial en el que un humano es un participante activo y, por tanto, puede comprobar el trabajo del modelo.

Las oportunidades para emprendedores y empresas en la IA generativa residen en casos de uso en los que los datos están muy estructurados, como el código de software. Además, un humano en el bucle puede mitigar el riesgo de los errores que puede cometer una IA. Las verticales de la industria y los casos de uso con estas características representan tan solo una oportunidad inicial con la IA generativa. Entre ellos se incluyen:

Creación de contenidos: La IA generativa puede mejorar la creatividad, el ritmo de creación de contenidos y su calidad. La tecnología también puede aprovecharse para analizar el rendimiento de diferentes tipos de contenido, como blogs o anuncios en redes sociales, y proporcionar información sobre lo que está resonando con la audiencia.

Servicio y atención al cliente: La IA generativa puede aumentar y automatizar el servicio y la atención al cliente a través de chatbots o asistentes virtuales. Esto ayuda a las empresas a proporcionar un servicio más rápido y eficiente a sus clientes, al tiempo que reduce el coste de las operaciones de atención al cliente. Mediante el preentrenamiento en grandes cantidades de datos de texto, los modelos de base pueden aprender a interpretar con precisión las consultas de los clientes y ofrecer respuestas más precisas, lo que se traduce en una mejora de la satisfacción del cliente y una reducción de los costes operativos. La diferenciación entre los nuevos operadores que aprovechan la IA generativa dependerá en gran medida de su capacidad para utilizar modelos más pequeños y afinados que permitan comprender mejor el lenguaje específico del sector, la jerga o las preguntas habituales de los clientes como mecanismo para ofrecer una asistencia a medida que satisfaga las necesidades de cada cliente y perfeccionar continuamente los productos para obtener resultados más precisos y eficaces.

Ventas y marketing: La IA puede analizar el comportamiento y las preferencias de los clientes y generar recomendaciones de productos personalizadas. Esto puede ayudar a las empresas a aumentar las ventas y el compromiso de los clientes. Además, los modelos afinados pueden ayudar a los equipos de ventas y marketing a dirigirse a los clientes adecuados con el mensaje correcto en el momento adecuado. Al analizar los datos sobre el comportamiento de los clientes, el modelo puede predecir qué clientes tienen más probabilidades de convertirse y qué mensajes serán más eficaces. Y eso se convierte en un fuerte diferenciador para que un nuevo operador capte cuota de mercado.

Desarrollo de software y productos: La IA generativa simplificará todo el ciclo de desarrollo, desde la generación de código hasta la finalización del mismo, la detección de errores, la documentación y las pruebas. Los modelos de base permiten a los desarrolladores centrarse en el diseño y la creación de características en lugar de corregir errores en el código. Por ejemplo, los nuevos operadores pueden ofrecer asistentes dotados de inteligencia artificial que entiendan conceptos de programación y proporcionen asistencia en función del contexto, ayudando a los desarrolladores a navegar por bases de código complejas, encontrar documentación relevante o sugerir fragmentos de código. Esto puede ayudar a los desarrolladores a ahorrar tiempo, perfeccionar sus habilidades y mejorar la calidad del código.

Conocer el pasado para ver el futuro

Aunque todavía estamos en los primeros días del inmenso valor que la IA generativa y los modelos de cimentación desbloquearán para las empresas y las startups, todo el mundo, desde los emprendedores hasta los responsables de la toma de decisiones, se beneficia de comprender cómo hemos llegado a donde estamos hoy. Además, comprender estos conceptos ayuda a darse cuenta del potencial de escala, replanteamiento y crecimiento de las oportunidades empresariales. Saber dónde están las oportunidades significa tomar decisiones inteligentes sobre lo que promete ser un futuro inspirador.

Imprimir Subir

TE PUEDE INTERESAR...

Tendencias

El grupo de centros deportivos GO fit optimiza su gestión financiera con IA y 'deep learning'

Liderazgo & Gestión TI

¿Qué es un proveedor de servicios gestionados? La externalización estratégica de servicios informáticos

Liderazgo & Gestión TI

Cómo ser el CIO que toda empresa desea

Entrevistas

“El gran reto consiste en seguir el compás de la innovación de los grandes modelos del lenguaje”

Tendencias

Oracle hace su apuesta por la nube empresarial; ¿deben escucharla los CIO?

Liderazgo & Gestión TI

Cuatrecasas apuesta por la inteligencia artificial para mejorar el trabajo de sus abogados

Transporte & Logística

La innovación alcanza velocidad de crucero en el vigésimo aniversario de Vueling

Liderazgo & Gestión TI

La IA, a punto de ocupar los puestos de trabajo que requieren menos experiencia en las grandes compañías financieras

Banca y seguros

Revolut inaugura en la Ciudad Condal un ‘hub’ tecnológico

Industria y Utilities

La Autoridad Portuaria de Baleares unifica sus sistemas TIC

Industria y Utilities

Toyota optimiza sus procesos en Europa para mejorar el ‘time to market’

Sanidad

El Hospital Ribera Polusa trata las fobias con su propio sistema de realidad virtual

Tendencias

6 tendencias que definen el mercado de TI empresarial actual

Retail

Fluidra traslada su gestión a la nube con RISE with SAP

Sanidad

"Ya nadie se plantearía montar un hospital comprando servidores"

Entrevistas

Empath-IA, una nueva forma de abordar la gestión de recursos humanos

CASOS DE ÉXITO

Cuatrecasas apuesta por la inteligencia artificial para mejorar el trabajo de sus abogados

17 ABR 2024

La firma, cuenta Francesc Muñoz, su CIO, apuesta constantemente por la innovación y la adopción de nuevas tecnologías para seguir mejorando y aportar mayor valor y eficiencia a los clientes.

La innovación alcanza velocidad de crucero en el vigésimo aniversario de Vueling

16 ABR 2024

Tras el despegue de la estrategia de transformación digital de la aerolínea y la consolidación de la innovación como motor propulsor, Javier Álvarez, CIO de Vueling, descifra cómo abordan el desafío de mejora continua.

A FONDO

La división española de Thales Alenia Space, al mando de las comunicaciones en la misión NEO Surveyor de la NASA

Visión tecnológica 2024: perspectivas de los CIO ante la revolución digital

Tecnología e innovación, el Olimpo del turismo

Los principales desafíos que enfrentarán los CIO en 2024

2023: un viaje tecnológico marcado por la resiliencia empresarial y la innovación

Accede a nuestra publicación de canal

Documentos ComputerWorld

Infraestructura como servicio: cómo implementar el 'cloud' sin caer en una gestión compleja

15 ABR 2024

La volatilidad ha venido para quedarse y las compañías tienen que adaptarse a gran velocidad, con infraestructuras tecnológicas que sean capaces de responder al mismo ritmo. En este contexto, el viaje hacia los modelos como servicio es una tendencia imparable que, junto con sus múltiples beneficios, también presenta retos. Descubre en este documento las principales conclusiones del debate.

Redes modernas y fiables: lo que la Fórmula 1 y los negocios tienen en común

12 FEB 2024

Para muchas organizaciones, la red empresarial es el eslabón más débil en su cadena de infraestructura. Por eso, las empresas deberán tener una red moderna, ágil yresiliente. Averigua en este libro electrónico a qué desafíos de red se enfrentan las compañías y cómo abordarlos.

'SAP S/4HANA Cloud, public edition', la solución impulsora de la eficiencia y la innovación

15 ENE 2024

La capacidad de adaptarse y evolucionar rápidamente es esencial para el éxito de cualquier empresa y, en este contexto, la elección de una infraestructura tecnológica sólida es vital. SAP S/4HANA Cloud, Public Edition emerge como una opción revolucionaria para impulsar la eficiencia operativa y la innovación empresarial.