Startups
Empresa
IA generativa

IA generativa: un cambio de paradigma en las oportunidades de las empresas y las ‘startups’

Comprender el papel que desempeñan las tecnologías subyacentes en el avance de la adopción y la innovación por parte de las empresas resulta crucial especialmente atendiendo a las tasas de impacto que registran.

inteligencia artificial

La inteligencia artificial (IA) generativa y sus modelos de base representan un cambio de paradigma en la innovación, con un impacto significativo en las empresas que exploran aplicaciones de IA. Por primera vez, gracias a los modelos de IA generativa, disponemos de sistemas que comprenden el lenguaje natural a un nivel casi humano y pueden generar y sintetizar resultados en diversos medios, incluidos texto e imágenes. Esta tecnología se apoya en potentes modelos básicos generales que sirven de base o punto de partida para desarrollar otros modelos de IA generativa más especializados. Estos modelos básicos se entrenan con grandes cantidades de datos. Cuando se les dan instrucciones en lenguaje natural, se pueden utilizar estos aprendizajes en un contexto específico para generar resultados de una sofisticación asombrosa. Una analogía de la IA generativa utilizada para crear imágenes puede ser el artista de talento que, en respuesta a las instrucciones de un mecenas, combina su exposición de toda la vida con la obra de otros artistas y su inspiración para crear algo totalmente novedoso.

Aunque la actualidad eclipsa sus avances y puede parecer que la IA generativa surgió de la nada para muchos líderes empresariales y ejecutivos, la realidad es que estas nuevas arquitecturas se basan en enfoques que han evolucionado a lo largo de las últimas décadas. Por lo tanto, es crucial reconocer el papel esencial que desempeñan las tecnologías subyacentes a la hora de impulsar el avance, la adopción por parte de las empresas y las oportunidades de innovación.

 

Cómo hemos llegado hasta aquí

Las tecnologías facilitadoras más notables de la IA generativa son el aprendizaje profundo, las incrustaciones, el aprendizaje por transferencia (todas ellas surgidas a principios o mediados de la década de 2000) y los transformadores de redes neuronales (inventados en 2017). La capacidad de trabajar con estas tecnologías a una escala sin precedentes -tanto en términos del tamaño del modelo como de la cantidad de entrenamiento- es un fenómeno reciente y de importancia crítica.

El aprendizaje profundo surgió en el mundo académico a principios de la década de 2000, con una adopción más amplia en la industria a partir de 2010. Un subcampo del aprendizaje automático -el aprendizaje profundo- entrena modelos para diversas tareas presentándoles ejemplos. El aprendizaje profundo puede aplicarse a un tipo concreto de modelo denominado red neuronal artificial, que consta de capas de nodos informáticos simples interconectados denominados neuronas. Cada neurona procesa la información que le transmiten otras neuronas y luego transmite los resultados a las neuronas de las capas siguientes. Los parámetros de los modelos de redes neuronales se ajustan utilizando los ejemplos presentados al modelo en el entrenamiento. De este modo, el modelo puede predecir o clasificar datos nuevos que no se habían visto antes. Por ejemplo, si tenemos un modelo entrenado con miles de fotos de perros, ese modelo puede utilizarse para detectar perros en imágenes no vistas anteriormente.

Por otro lado, el aprendizaje por transferencia surgió a mediados de la década de 2000 y se popularizó rápidamente. Se trata de una técnica de aprendizaje automático que utiliza los conocimientos adquiridos en una tarea para mejorar el rendimiento del modelo en otra. Una analogía para entender esta potente técnica es aprender una de las "lenguas romances", como el español. Debido a sus similitudes, puede resultar más fácil aprender otra lengua románica, como el italiano. El aprendizaje por transferencia es esencial en la IA generativa porque permite que un modelo aproveche el conocimiento de una tarea en otra relacionada. Esta técnica ha demostrado ser innovadora, ya que mitiga el problema de la escasez de datos. El aprendizaje por transferencia también puede mejorar la diversidad y la calidad de los contenidos generados. Por ejemplo, un modelo pre-entrenado en un gran conjunto de datos de texto puede afinarse en un conjunto de datos más pequeño de texto específico de un determinado dominio o estilo. De este modo, el modelo puede generar un texto más coherente y pertinente para un determinado ámbito o estilo.

Otra técnica que se impuso entre principios y mediados de la década de 2000 fue la incrustación. Se trata de una forma de representar datos, con mayor frecuencia palabras, como vectores numéricos. Las tecnologías orientadas al consumidor, como ChatGPT, demuestran lo que parece una lógica humana y son un gran ejemplo del poder de las incrustaciones de palabras. Las incrustaciones de palabras están diseñadas para captar las relaciones semánticas y sintácticas entre las palabras. Por ejemplo, la representación en un espacio vectorial de las palabras ‘perro’ y ‘león’ estaría mucho más próxima entre sí que al espacio vectorial de ‘manzana’. La razón es que ‘perro’ y ‘león’ tienen considerables similitudes contextuales. En la IA generativa, esto permite a un modelo comprender las relaciones entre las palabras y su significado en el contexto, lo que hace posible que modelos como ChatGPT proporcionen un texto original contextualmente relevante y semánticamente preciso.

Las incrustaciones tuvieron un enorme éxito como representación del lenguaje e impulsaron la exploración de nuevas arquitecturas de redes neuronales más potentes. Una de las más importantes, el "transformador", se desarrolló en 2017. El transformador es una arquitectura de red neuronal diseñada para procesar datos de entrada secuenciales, como el lenguaje natural, y realizar tareas como el resumen o la traducción de textos. En particular, el transformador incorpora un mecanismo de autoatención. Esto permite al modelo centrarse en distintas partes de la secuencia de entrada según sea necesario para captar relaciones complejas entre palabras de forma sensible al contexto. Así, el modelo puede aprender a ponderar la importancia de cada parte de los datos de entrada de forma diferente para cada contexto. Por ejemplo, en la frase "el perro no saltó la valla porque estaba demasiado cansado", el modelo examina la frase para procesar cada palabra y su posición. A continuación, mediante la autoatención, el modelo evalúa las posiciones de las palabras para encontrar la asociación más cercana con ‘eso’. La autoatención se utiliza para generar una comprensión de todas las palabras de la frase en relación con la que estamos procesando en ese momento, ‘eso’. Por lo tanto, el modelo puede asociar la palabra ‘eso’ con la palabra ‘perro’ en lugar de con la palabra ‘valla’.

Los avances en las arquitecturas de aprendizaje profundo, la computación distribuida de manera eficiente y los algoritmos y metodologías de entrenamiento han hecho posible entrenar modelos más grandes. En el momento de escribir este artículo, el modelo más grande es ChatGPT3 de OpenAI, que consta de 173 mil millones de parámetros; la información de los parámetros de ChatGPT4 aún no está disponible. ChatGPT3 también es digno de mención porque ha absorbido las mayores cantidades de texto conocidas públicamente, 45 TB de datos, en forma de ejemplos de texto, todo el contenido textual de Internet y otras formas de expresión humana.

Aunque el uso combinado de técnicas como el aprendizaje por transferencia, la incrustación y los transformadores para la IA Generativa es evolutivo, el impacto en la forma en que se construyen los sistemas de IA y en la adopción por parte de la empresa es revolucionario. Como resultado, la carrera por el dominio de los modelos de base, como los populares modelos de lenguaje de gran tamaño (LLM), está en marcha con las empresas ya establecidas y las nuevas compitiendo por una posición en la que el ganador se lo lleva todo o la mayoría.

Aunque los requisitos de capital para los modelos básicos son elevados, lo que favorece a las grandes empresas tecnológicas tradicionales o a las nuevas empresas con una financiación muy elevada (miles de millones de dólares), las oportunidades de disrupción por parte de la IA Generativa son amplias y profundas en toda la empresa.

 

Entendiendo el stack tecnológico

Para aprovechar eficazmente el potencial de la IA generativa, las empresas y los emprendedores deben comprender cómo se clasifican sus capas tecnológicas y las implicaciones que cada una de ellas tiene en la creación de valor.

La forma más básica de entender las tecnologías en torno a la IA generativa es organizarlas en una pila tecnológica de tres capas. En la parte inferior de esta pila se encuentran los modelos básicos, que representan una ola transformadora en la tecnología análoga a la informática personal o la web. Esta capa estará dominada por operadores consolidados como Microsoft, Google y Meta, en lugar de nuevas empresas emergentes, lo que no difiere demasiado de lo que vimos con la revolución móvil o la computación en nube. Hay dos razones fundamentales para este fenómeno. En primer lugar, la escala a la que operan estas empresas y el tamaño de sus balances son bastante significativos. En segundo lugar, los operadores tradicionales actuales han acaparado los principales recursos que alimentan los modelos fundacionales: la informática y los datos.

En la parte superior de esta pila se encuentran las aplicaciones: software desarrollado para un caso de uso concreto diseñado para una tarea específica. A continuación está la capa intermedia. En ella, las tecnologías habilitadoras potencian las aplicaciones de la capa superior y amplían las capacidades de los modelos básicos. Por ejemplo, MosaicML permite a los usuarios crear su propia IA a partir de sus datos, convirtiéndolos en un modelo de IA a gran escala que ejecuta eficazmente cargas de trabajo de aprendizaje automático en cualquier nube de la infraestructura del usuario. Cabe destacar que en este debate falta una evaluación en profundidad de la capa intermedia. Hacer predicciones sobre esta parte de la pila en una fase tan temprana del ciclo entraña muchos riesgos. Mientras que las herramientas gratuitas de los operadores tradicionales que buscan impulsar la adopción de sus modelos básicos podrían llevar a una mercantilización de la capa intermedia, las herramientas de modelos multiplataforma o multifundamentales que ofrecen capacidades añadidas y optimizan los modelos que mejor se adaptan a un caso de uso podrían cambiar las reglas del juego.

A corto plazo, antes de que se desarrollen más los productos y plataformas de la capa intermedia, la capa de aplicación representa la mayor parte de las oportunidades para los inversores y creadores de IA generativa. Especialmente interesantes son los productos orientados al usuario que ejecutan sus propias canalizaciones de modelos, a menudo además de los modelos de fundaciones públicas. Se trata de aplicaciones integrales. Estas aplicaciones integradas verticalmente, desde el modelo hasta la capa de aplicación orientada al usuario, representan el mayor valor, ya que proporcionan una mayor defensa. El modelo propietario es valioso porque el reentrenamiento continuo de un modelo en datos de productos propietarios crea una mayor defensa y diferenciación. Sin embargo, esto tiene el coste de una mayor intensidad de capital y crea retos para que un equipo de producto se mantenga ágil.

 

Casos de uso en aplicaciones de IA generativa

La consideración adecuada de los casos de uso y las oportunidades a corto plazo de la capa de aplicación para la IA generativa requiere conocer el valor incremental de los datos o contenidos y una comprensión completa de las consecuencias de la precisión imperfecta. Por lo tanto, las oportunidades a corto plazo serán aquellas con un alto valor de datos o contenidos incrementales, donde más datos o contenidos tengan valor económico para el negocio y bajas consecuencias de precisión imperfecta. Otras consideraciones son la estructura de los datos para el entrenamiento y la generación y el papel del human-in-the-loop, un sistema de inteligencia artificial en el que un humano es un participante activo y, por tanto, puede comprobar el trabajo del modelo.

Las oportunidades para emprendedores y empresas en la IA generativa residen en casos de uso en los que los datos están muy estructurados, como el código de software. Además, un humano en el bucle puede mitigar el riesgo de los errores que puede cometer una IA. Las verticales de la industria y los casos de uso con estas características representan tan solo una oportunidad inicial con la IA generativa. Entre ellos se incluyen:

Creación de contenidos: La IA generativa puede mejorar la creatividad, el ritmo de creación de contenidos y su calidad. La tecnología también puede aprovecharse para analizar el rendimiento de diferentes tipos de contenido, como blogs o anuncios en redes sociales, y proporcionar información sobre lo que está resonando con la audiencia.

Servicio y atención al cliente: La IA generativa puede aumentar y automatizar el servicio y la atención al cliente a través de chatbots o asistentes virtuales. Esto ayuda a las empresas a proporcionar un servicio más rápido y eficiente a sus clientes, al tiempo que reduce el coste de las operaciones de atención al cliente. Mediante el preentrenamiento en grandes cantidades de datos de texto, los modelos de base pueden aprender a interpretar con precisión las consultas de los clientes y ofrecer respuestas más precisas, lo que se traduce en una mejora de la satisfacción del cliente y una reducción de los costes operativos. La diferenciación entre los nuevos operadores que aprovechan la IA generativa dependerá en gran medida de su capacidad para utilizar modelos más pequeños y afinados que permitan comprender mejor el lenguaje específico del sector, la jerga o las preguntas habituales de los clientes como mecanismo para ofrecer una asistencia a medida que satisfaga las necesidades de cada cliente y perfeccionar continuamente los productos para obtener resultados más precisos y eficaces.

Ventas y marketing: La IA puede analizar el comportamiento y las preferencias de los clientes y generar recomendaciones de productos personalizadas. Esto puede ayudar a las empresas a aumentar las ventas y el compromiso de los clientes. Además, los modelos afinados pueden ayudar a los equipos de ventas y marketing a dirigirse a los clientes adecuados con el mensaje correcto en el momento adecuado. Al analizar los datos sobre el comportamiento de los clientes, el modelo puede predecir qué clientes tienen más probabilidades de convertirse y qué mensajes serán más eficaces. Y eso se convierte en un fuerte diferenciador para que un nuevo operador capte cuota de mercado.

Desarrollo de software y productos: La IA generativa simplificará todo el ciclo de desarrollo, desde la generación de código hasta la finalización del mismo, la detección de errores, la documentación y las pruebas. Los modelos de base permiten a los desarrolladores centrarse en el diseño y la creación de características en lugar de corregir errores en el código. Por ejemplo, los nuevos operadores pueden ofrecer asistentes dotados de inteligencia artificial que entiendan conceptos de programación y proporcionen asistencia en función del contexto, ayudando a los desarrolladores a navegar por bases de código complejas, encontrar documentación relevante o sugerir fragmentos de código. Esto puede ayudar a los desarrolladores a ahorrar tiempo, perfeccionar sus habilidades y mejorar la calidad del código.

 

Conocer el pasado para ver el futuro

Aunque todavía estamos en los primeros días del inmenso valor que la IA generativa y los modelos de cimentación desbloquearán para las empresas y las startups, todo el mundo, desde los emprendedores hasta los responsables de la toma de decisiones, se beneficia de comprender cómo hemos llegado a donde estamos hoy. Además, comprender estos conceptos ayuda a darse cuenta del potencial de escala, replanteamiento y crecimiento de las oportunidades empresariales. Saber dónde están las oportunidades significa tomar decisiones inteligentes sobre lo que promete ser un futuro inspirador.



TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS