Seguridad
IA
Protección de datos

Sopesar riesgos y beneficios en la selección de proveedores de IA generativa

La IA generativa ha generado un cambio tecnológico sin precedentes, pero las complicaciones a la hora de elegir proveedores de IA han crecido en igual medida. Así se deben preparar los líderes para ayudar a las empresas.

decisión
Créditos: Bethany Legg (Unsplash).

A mediados de noviembre, el consejo de OpenAI despidió al consejero delegado de la empresa, Sam Altman, el hombre que puso ChatGPT en el mapa y marcó el comienzo de una nueva era de despliegues corporativos de IA. En los tres días siguientes, casi todos los empleados de la empresa dijeron que saldrían por la puerta, y el destino de OpenAI parecía extremadamente incierto.

Empresas enteras se han construido sobre OpenAI y sus API.

Según una encuesta de O'Reilly publicada a finales del mes pasado, el 23% de las empresas utilizan alguno de los modelos de OpenAI. Su competidor comercial más cercano, Bard de Google, está muy por detrás, con sólo un 1% del mercado. Otros encuestados afirmaron que no utilizan ningún modelo de IA generativa, que están creando uno propio o que utilizan una alternativa de código abierto.

Dejando a un lado el hecho de que se trata de una tasa de adopción astronómicamente alta para una tecnología totalmente nueva, también es un indicador de lo arriesgado que es este espacio. Una empresa que apostara su futuro por ChatGPT tendría serios problemas si la herramienta desapareciera y todas las API de OpenAI dejaran de funcionar de repente. Así que si OpenAI estuvo a punto de derrumbarse de la noche a la mañana, ¿qué nos dice esto sobre las probabilidades de supervivencia de las innumerables startups de este espacio?

Según el último informe de G2 sobre el estado del software, la IA es la categoría de software de más rápido crecimiento en la historia de G2. La empresa rastrea ahora un total de 1.078 proveedores de IA, y las categorías de IA ganaron 643 nuevos productos respecto al año anterior.

Los medios sintéticos, que incluyen texto, imágenes, audio y vídeo generados por IA, crecieron un 222% en comparación con el año anterior. Y la categoría de asistentes de escritura de IA creció un 177%. Así que las empresas que buscan proveedores de IA generativa tienen muchas opciones entre las que elegir.

Hemos estado llevando a cabo una amplia investigación con socios como Gartner, McKinsey y otros para entender el panorama del mercado y cómo otras empresas están utilizando esta tecnología", dice Yexi Liu, CIO de la multinacional de productos alimenticios Rich Products. Esta empresa de 5.800 millones de dólares tiene 13.000 empleados y presencia en más de 110 países, y ya ha elegido a sus proveedores de IA más amplios: Microsoft, SAP y Salesforce.

Más allá de eso, la mayoría de los proveedores siguen quedándose cortos.

"Muchos proveedores de IA generativa afirman que ofrecen una solución de IA de extremo a extremo", afirma Liu. "Pero la realidad es que muchas de estas empresas todavía están en las primeras etapas. Todavía no hay un líder claro en el mercado".

A la hora de evaluar a los proveedores, Rich Products se fija en su tecnología, arquitectura, valor empresarial y perspectiva pragmática. El objetivo, dice, es entender cómo la IA beneficiará al negocio de Rich en general. "Nos fijamos en la madurez del proveedor y en si ha demostrado tener éxito en las áreas de interés adecuadas para nuestro negocio", comenta.

No es el único. Según una encuesta de Ernst & Young a 1.200 directores ejecutivos de todo el mundo publicada a finales de octubre, el 99% tiene previsto realizar o ya está realizando inversiones "significativas" en IA generativa. Pero no es precisamente una apuesta segura. El riesgo de quiebra es sólo uno de los muchos escenarios catastróficos con los que tienen que lidiar los pioneros. También está la amenaza siempre presente de las demandas por derechos de autor relacionadas con el texto y las imágenes generados por la IA, la precisión del contenido generado por la IA y el riesgo de que la información confidencial se convierta en datos de entrenamiento para la siguiente generación del modelo de IA y quede expuesta al mundo. Hay sesgos tanto en los conjuntos de datos de entrenamiento como en los resultados, y existen preocupaciones éticas, costes galopantes, retos de integración, deriva del modelo, falta de transparencia, riesgos de seguridad de los datos, riesgos de plagio y riesgos normativos.

Y no son sólo las empresas de nueva creación las que pueden exponer a una empresa a riesgos de terceros relacionados con la IA. Los proveedores establecidos también se apresuran a incorporar la IA generativa a sus productos y servicios.

Adoptar una actitud de espera ante la IA generativa también conlleva riesgos significativos, como perder personal y clientes a manos de competidores más ágiles y quedarse atrás a la hora de comprender cómo utilizar la nueva tecnología.

Así que las principales preguntas que van más allá de la diligencia debida habitual que deben plantearse las empresas al evaluar a los proveedores de IA generativa tienen que ver con los datos de formación, los derechos de autor, el valor añadido y la independencia del modelo.

 

Protección de datos, seguridad y conformidad

Para Rich Products, la protección de datos, la IA responsable y la IA digna de confianza son fundamentales.

"Es imperativo que protejamos nuestra propiedad intelectual y que nos aseguremos de que nuestras soluciones de IA estén diseñadas para ser justas, imparciales, seguras y explicables", afirma. "Esto no es negociable y es algo que definiremos claramente con el proveedor desde el principio. No vamos a entrar en una asociación a ciegas".

Además, en el caso de información y datos empresariales especialmente sensibles, espera ver aún más seguridad. "El proveedor debe ofrecernos la capacidad de construir la solución de IA en nuestro propio inquilino", afirma.

Muchas empresas ya tenían la ciberseguridad y la privacidad de los datos en la parte superior o cerca de la parte superior de sus listas de verificación al seleccionar proveedores, ya sean de IA o no. Y en los sectores regulados, los proveedores también deben cumplir normativas específicas, como HIPAA o PCI.

El mismo enfoque puede ampliarse para incluir a los proveedores, productos y servicios de IA generativa, pero hay algunos giros nuevos. Por ejemplo, las empresas ya deberían preguntar qué tipo de auditorías y normas de seguridad aplican los proveedores en sus entornos de nube, afirma Arun Chandrasekaran, analista de Gartner.

Ahora, con la IA generativa, también deben preguntar sobre las medidas que toman los proveedores para garantizar que los datos sigan siendo privados y no se utilicen para entrenar y enriquecer sus modelos, afirma.

"¿Cómo se almacenan los datos puntuales en su entorno?", pregunta. "¿Puedo ejecutarlo en mi propia nube virtual?".

Megan Amdahl, SVP de alianzas y operaciones de socios en Insight, un integrador de soluciones con sede en Arizona, dice que su compañía evalúa a los proveedores de IA generativa tanto para uso interno como en nombre de sus clientes.

Insight cuenta con un equipo de gestión de contratos de socios que examina detenidamente los acuerdos con los proveedores.

"Si tienen algún término que consideramos arriesgado o cuestionable, exigimos una revisión ejecutiva", dice. "Y no solo contamos con nuestro equipo de contratos para la firma original, sino también para revisar todos los apéndices que solicitan, para asegurarnos de que estamos protegidos contra cualquier tipo de riesgo que se pueda insertar".

No se trata sólo de una preocupación teórica. A principios de este año, el proveedor de videoconferencias Zoom añadió funciones de IA generativa, incluidos resúmenes automáticos de reuniones. En marzo, se concedió a sí mismo el derecho a utilizar los datos de los clientes para entrenar sus modelos. Las empresas se levantaron en armas cuando descubrieron la letra pequeña este verano y Zoom dio marcha atrás rápidamente.

 

Entrenamiento de modelos

Que los proveedores entrenen sus modelos con datos de clientes no es el único riesgo de la IA generativa relacionado con el entrenamiento. Varios proveedores de IA, entre ellos OpenAI, han sido demandados por artistas, autores y otros titulares de derechos de autor. Dependiendo de cómo vayan estos pleitos, los proveedores podrían tener que cambiar sus modelos de negocio o su estructura de precios para pagar a los propietarios de los derechos de autor, o incluso cerrar el negocio.

Además de las demandas, también existe la posibilidad de que se adopten medidas normativas que prohíban determinados tipos de datos de formación. Estos riesgos podrían, potencialmente, extenderse a las empresas que utilizan estos productos y servicios.

Las empresas también deben preguntar a los proveedores sobre el proceso de formación de sus modelos, dice Chandrasekara. "¿Hasta qué punto son transparentes en su proceso de formación de modelos?".

En concreto, cómo se aseguran de que no están infringiendo datos privados, pregunta, y si existen acciones legales contra la empresa.

Hay otra pregunta que las empresas pueden hacerse, añade: "¿Qué tipo de protección jurídica e indemnización legal me ofrecen como cliente?".

Varios grandes proveedores ya han anunciado que indemnizarán a los clientes empresariales por los posibles riesgos de derechos de autor asociados al uso de sus productos. Microsoft, por ejemplo, anunció en septiembre su política de indemnización legal para Copilot. En caso de que se le impugne por motivos de derechos de autor, asumiremos la responsabilidad de los riesgos potenciales.

Google anunció una política similar en octubre, con una redacción casi idéntica, y

Adobe, que ofrece el modelo de generación de imágenes Firefly, anunció su propia indemnización legal en junio. Firefly es el modelo que impulsa la nueva función de relleno generativo de Photoshop y otros productos de Adobe, y también está disponible como servicio independiente. Getty, OpenAI y Amazon no tardaron en seguirle.

 

¿Tienen un foso?

Cuando se lanzó ChatGPT, no era capaz de leer documentos PDF, pero la capacidad de analizar el contenido de un PDF es uno de los principales casos de uso empresarial de la IA generativa. Por ello, surgieron varias empresas para cubrir esta carencia.

En octubre, ChatGPT añadió una función de carga de PDF, con lo que la mayoría de estas empresas emergentes se volvieron irrelevantes de la noche a la mañana. Las empresas que crearon cargas de trabajo PDF utilizando la tecnología de esas start-ups se enfrentaban ahora al riesgo de quebrar antes de que sus clientes pudieran reconstruir los sistemas.

Según Andy Thurai, vicepresidente y analista principal de Constellation Research, no se trata de un problema nuevo. Una startup puede quedarse obsoleta fácilmente en cualquier ámbito de la tecnología. "La diferencia es que la velocidad a la que los modelos de IA están liberando características es alucinante", asegura Thurai. "Con otras iteraciones de software no era tan rápido. Se tardaba entre seis meses y un año". Eso daría a los proveedores más pequeños tiempo para seguir innovando, o a los clientes para migrar.

Thurai recomienda a las empresas que se acerquen a sus proveedores de IA con una filosofía de "interruptor de corte", y no sólo por el riesgo de que se queden obsoletos.

Podría haber un problema de gestión u organización, como ocurrió en OpenAI, dice.

"Y existe la posibilidad de que algunos de estos proveedores quiebren en poco tiempo", añade. "Pueden agotar rápidamente su liquidez y quebrar. O que pirateen uno de sus sistemas y ya no quieras que tus llamadas pasen por ahí".

Para prepararse para esa eventualidad, las empresas deben tener un plan de respaldo que les permita seguir operando sin ese proveedor concreto.

"Hay que tener una opción de interruptor de corte", dice.

Según Sandeep Agrawal, responsable de tecnología jurídica y alianzas de PricewaterhouseCoopers, las empresas también deben prestar atención a la capacidad de defensa de la oferta de productos de un proveedor.

"Muchas empresas ponen una fina envoltura alrededor de GPT-4 o Claude 2 y lo llaman IA generativa", afirma. "Pero, ¿qué hay realmente debajo? Y ¿tienen los conjuntos de habilidades adecuados en términos de ingeniería y gobernanza?".

Si un proveedor no está añadiendo mucho valor significativo, tendrá dificultades para mantenerse en el negocio, especialmente si su característica clave es implementada por la propia plataforma de IA, como sucedió con los PDF.

"Nuestro equipo jurídico y de compras tiene que entender y analizar documentos PDF y contratos, algunos de los cuales se firmaron hace 20 años", afirma.

Así que PricewaterhouseCoopers se beneficiaría de un proveedor que ofreciera la posibilidad de leer PDF, pero ahora es una función estándar y no necesita un proveedor aparte. A menos que el proveedor hiciera algo especial. "Por ejemplo, digamos que han cargado millones de contratos y comprenden el lenguaje específico de los contratos, y han dedicado tiempo y esfuerzo a formar y ajustar el modelo para obtener mejores respuestas a preguntas específicas", afirma.

Y un ‘kill switch’ es algo más que la capacidad técnica de cambiar de proveedor sin reconstruir toda una solución, dice Nick Kramer, vicepresidente de soluciones aplicadas de SSA & Company. "También incluye la capacidad contractual de poner fin a la relación".

Un modelo de base genérico daría respuestas genéricas a los PDF, añade. Eso podría funcionar para un usuario empresarial general, pero no para alguien de un ámbito muy específico y técnico. Hacer esta puesta a punto internamente llevaría mucho tiempo, añade, ya que la velocidad de comercialización es muy importante.

PricewaterhouseCoopers tiene 4.000 abogados y muchos datos confidenciales relacionados con documentos jurídicos.

"Si tienes datos de propiedad, puedes utilizarlos para crear modelos de dominio especializados para contratos, investigación jurídica, litigios y reclamaciones", dice. "Pero si intentas construir todo eso por ti mismo, no tendrás éxito en términos de velocidad de comercialización. Y esa es una razón importante por la que elegimos empresas que ya lo han hecho".

Los proveedores especializados, por ejemplo, en PDF jurídicos, financieros o relacionados con la industria farmacéutica podrían seguir aportando valor.

"Los vendedores tienen que entender el entorno de su sector específico", afirma. "¿Pueden crear atributos adicionales, mejores interfaces de usuario y un flujo de trabajo más amigable?".

 

Independencia del modelo

Además de buscar proveedores que aporten un valor añadido significativo al modelo básico que utilizan, PricewaterhouseCoopers también elige proveedores que sean flexibles en cuanto al modelo que utilizan.

"Hace doce meses, todos los proveedores se centraban en lo que ChatGPT estaba haciendo y construyendo", afirma Agrawal. "Ahora, muchos de los proveedores establecidos son multimodelo en el back-end. Están probando diferentes modelos de base para diferentes cosas".

Puede ocurrir que un modelo base no funcione o que aparezca otro mejor para un caso de uso concreto.

"Si no eres lo bastante flexible y ágil, tus clientes se irán", asevera.

En la actualidad existen más de 200 modelos básicos, afirma Lian Jye Su, analista jefe de inteligencia aplicada de la consultora tecnológica Omdia.

"El proveedor debe conocer a fondo las capacidades y tecnologías del modelo de base adecuado", afirma. "Y los modelos de cimentación son propensos a la alucinación, por lo que deben estar fundamentados y enlazados con bases de datos vectoriales externas".

Ahora hay más de 20 bases de datos vectoriales alojadas diferentes entre las que elegir, dice, cada una con sus propios puntos fuertes. Y no sólo los proveedores deben ser flexibles en cuanto al modelo de base que utilizan. Según Chandrasekaran, de Gartner, las empresas que perfeccionan o entrenan sus propios sistemas de IA generativa también deben hacer todo lo posible por ser agnósticas en cuanto al modelo.

"El modelo que utilizan hoy no será el mismo que utilizarán dentro de 12 meses", afirma. "Necesitan tener la capacidad de intercambiar esos modelos".

En el caso de las empresas que consumen modelos de base directamente, pueden construir sus sistemas de modo que la capa API esté aislada del resto de la aplicación. De este modo, pueden realizar la llamada a la API al mejor modelo para la tarea, o cambiar completamente de modelo cuando aparezcan otros mejores o más baratos.

Otro enfoque que están estudiando algunas empresas es crear capas de orquestación de IA que puedan abarcar varios sistemas y conectarse a diferentes proveedores de nube, diferentes fuentes de datos, diferentes modelos básicos e incluso diferentes plataformas de software empresarial.

Ram Palaniappan, director de tecnología de TEKsystems, un integrador de sistemas, afirma: "Cuando analizamos el flujo de negocio, tenemos que verlo de principio a fin". "Puede comenzar con Salesforce y terminar en Oracle, pero necesita comenzar con la experiencia del usuario, y el caso de uso de extremo a extremo impulsará cómo vinculas esas cosas".

Hay múltiples proveedores que ofrecen estas súper apps de IA, afirma, y los hiperescaladores también están desplegando sus propias opciones.

LangChain es la opción de código abierto más conocida en este ámbito. Nvidia tiene una solución, y Meta tiene LlamaIndex, que también está ganando adeptos entre las empresas, confiesa Palaniappan.

"Algunos proveedores de plataformas, como Google, están construyendo su propia capa de aplicación", afirma. "Permiten múltiples modelos de cimientos y también se integran con LangChain". Microsoft y AWS también tienen sus propios creadores de aplicaciones, añade.

Es una buena opción para las empresas que apuestan por una única plataforma en la nube. "Si quieres integrar en la capa de la app una súper app de terceros será una buena opción", dice. "Algo como LangChain, que es portátil en las tres plataformas de nube, pero si la mayoría de sus necesidades pueden satisfacerse con un hiperescalador, entonces no lo necesita".



TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS