Entrevista
Analítica de datos

"Es necesaria la colaboración público-privada para llevar a buen puerto la economía del dato"

El doctor en física teórica y experto en analítica de datos Alberto Palomo, chief data officer de España, expone la relevancia de su función, clave para establecer un gobierno claro del ecosistema de datos en este país y, por ende, para desplegar la llamada 'economía del dato' a escala nacional.

Alberto Palomo, CDO de España
Play

 Esther Macías / Imagen: Juan Márquez

El Gobierno nombraba en julio del pasado año a Alberto Palomo Lozano como el primer Chief Data Officer (CDO) de España. Este doctor en física teórica y experto en analítica de datos, con experiencia en empresas como Iberdrola o Huawei, apostó entonces por dar el salto al sector público y ponerse al frente de la Oficina del Dato, un ente que depende de la Secretaría de Estado de Digitalización e Inteligencia Artificial y que persigue impulsar un marco que garantice la soberanía de los datos en España y a nivel europeo, promoviendo la construcción de centros de datos y el procesamiento y almacenamiento de esos datos en España.

Palomo expone en una entrevista realizada con ComputerWorld en qué medidas de compartición y uso de los datos públicos y privados trabaja la Oficina y por qué apoya al hub español de la iniciativa privada GAIA-X.


Está a punto de cumplirse un año desde su nombramiento como primer CDO de España. ¿Cómo valora este periodo al frente de la Oficina del Dato?

Sí, a finales de julio hará justo un año. Ha sido un año intenso —lo está siendo— tanto en el aprendizaje de asuntos puramente tecnológicos (como los modelos de referencia para la compartición de datos y las arquitecturas tecnológicas que siguen normas internacionales) como en otros más estratégicos como la Estrategia Europea de Datos. Este aprendizaje es importante porque es lo que aporta la capacidad de cocrear y diseñar el aterrizaje de esas estrategias y modelos tecnológicos a la realidad española.

Lo que buscamos desde la Oficina del Dato es fomentar la economía del dato en base a conceptos tecnológicos de soberanía y esto va de la mano, primero, de entender estos modelos, de ser capaz de crear instanciaciones de referencia en la práctica de dichos modelos y de aunar los aspectos regulatorios con los propios modelos de negocio de las industrias y de los sectores sobre los que desplegar estos modelos. Por ello, es importante entender los modelos de incentivos y comprender que este es un proceso de cocreación entre nuestra propia Oficina y la parte gubernamental y la capilaridad del mercado y los sectores que al final van a operar sobre dichos modelos.

 

¿Por qué España necesitaba un CDO? ¿Qué aprendizajes se pueden aprovechar de otros países de nuestro entorno donde existen figuras similares?

Es un rol relativamente reciente. Aunque es más común en organizaciones privadas, también hay puestos equivalentes en el sector público, por ejemplo, en países como Francia, Reino Unido o Estados Unidos; no obstante, el modelo español es algo diferente. ¿Por qué era importante que hubiera un CDO? Primero porque a nivel de país existía un vacío en la forma de compartir datos. Generalmente, en estas posiciones, como ocurre en las organizaciones privadas, esto tiene mucho que ver con cómo gestionar y operar los datos que uno dispone en la propia organización. Eso sigue existiendo. En los propios ministerios y en muchas organizaciones públicas hay roles que operan sobre los resultados y extraen valor de estos, pero el rol que juega la Oficina del Dato no es exactamente ese. Nosotros nos encontramos una capa por debajo y venimos a habilitar una capa de compartición transversal, horizontal, en base a la creación de marcos de referencia, de líneas generales, de apoyo y coordinación. No venimos a sustituir la capacidad de crear valor con los datos a nivel sectorial o en cada departamento ministerial.

 

"Lo que buscamos desde la Oficina del Dato es fomentar la economía del dato en base a conceptos tecnológicos de soberanía"

 

En España, además de que esto es novedoso, estamos aunando esa parte pública con la privada porque el valor está en conectar los dos mundos. El Estado es uno de los mayores generadores de datos del país y queremos poner ese trabajo que se lleva a cabo dentro de los propios ministerios —obviamente con las condiciones de seguridad, confidencialidad y soberanía necesarias— a disposición de las organizaciones privadas para que puedan crear productos de datos y propuestas de valor mucho más interesantes.

 

El objetivo último de la Oficina del Dato es “dar respuesta a los grandes retos que existen en España en lo que respecta a la economía del dato”, un mercado que, según el estudio European Data Market de la UE, está previsto que pase de representar el 2,5% del PIB nacional en 2019 a más del 4% en 2025. ¿Cuáles son estos desafíos y cómo los afrontarán?

La compartición y explotación de datos ya existe pero hay poderosas barreras para hacerlo a mayor escala. Esto tiene mucho que ver con los retos culturales, no solo tecnológicos, porque existen reticencias o miedos. Por un lado, está el miedo a la falta de privacidad y las responsabilidades que puede originar esa compartición de datos; por otro, la parte competitiva: todos hablamos de que los datos son el petróleo de las organizaciones y muchos se preguntarán si quieren perder ese recurso. También hay aspectos más operativos como las inversiones que son necesarias, el problema de la falta de talento e incluso aspectos normativos. 

En este sentido, la Estrategia Europea de Datos persigue abordar estos desafíos. Esta estrategia, en la que nos basamos nosotros, tiene cuatro grandes pilares: los marcos de gobernanza de uso y reuso del dato; una parte de infraestructuras digitales y capacidad de digitalización, es decir, la parte más tecnológica; la capacitación de talento; y el despliegue de espacios de datos sectoriales, vehículos donde todos estos aspectos se dan forma para resolver esos retos que existen.

   

 

La Estrategia Europea del Dato, que surge en 2020, tiene que materializarse en proyectos concretos en los que están trabajando. ¿Cuáles son?

Nuestra Oficina llega para facilitar el aterrizaje de esa estrategia de la Comisión Europea. Trabajamos en dos ámbitos separados pero complementarios: la parte de compartición de datos entre organismos públicos (G2G o government to government) y con empresas privadas. 

En la primera tenemos un grupo de trabajo con diferentes centros directivos de la Administración General del Estado, donde primero identificamos qué conjuntos de datos se comparten ya. Además, de forma más genérica, queremos entender qué otros conjuntos de datos puede ser interesante que organismos cesionarios den a organismos cedentes y que lo hagan con soberanía y con seguridad. A partir de ahí, proponemos estrategias y mecanismos y proyectos concretos que nos permitan abordar ese tipo de proyectos desde el punto de vista de la economía de escala, porque al final muchos de estos desafíos son comunes. Una de las cosas que desarrollamos son guías generales para saber por dónde empezar cuando un organismo determinado quiere arrancar un proyecto pero quiere evitar tener que empezar desde cero.

Respecto a la parte de B2B, la compartición de datos con empresas privadas, ahí no podemos ordenar sobre cómo trabajar, sino sugerir y acompañar. Y mucho de lo que hacemos tiene que ver con estos espacios de datos sectoriales y de cómo tomamos estos marcos generales de referencia y empezamos a valorar las diferentes perspectivas en la creación de valor desde un punto de vista privado, es decir, modelos de negocio, cómo afectan aspectos normativos, aspectos operacionales y técnicos (cómo gobierno los datos, qué semántica, qué limpieza tiene que haber detrás, qué metodologías y arquitecturas se pueden utilizar…). Recientemente, estamos trabajando en cómo mapear esos criterios de la compartición a templates, a plantillas y arquitecturas tecnológicas para que, al igual que perseguimos con los centros públicos en este sentido, las organizaciones privadas no tengan que empezar desde cero porque la gran dificultad en esto es cómo arrancar y generar escala.

 

La Oficina del Dato participa activamente en el hub español de Gaia-X, la iniciativa europea de nube abierta e infraestructuras de datos. ¿Cuál es su papel y por qué es importante estar ahí?

Gaia-X en realidad es un proyecto privado del que existe un hub en España. Este centro se rige por la normativa privada pero ha recibido un gran impulso por parte de la Secretaría de Estado de Inteligencia Artificial y por el propio Ministerio de Economía y Transformación Digital porque es una pata que nos permite habilitar esa visión de la estrategia que tiene la Comisión Europea y que comparte España como Estado miembro. 

Nuestro objetivo es habilitar la economía del dato y la innovación en base a datos y a tener estructuras y arquitecturas tecnológicas que permitan la soberanía del dato, por eso, aunque como Oficina del Dato no somos parte del hub como tal, lo apoyamos fuertemente para impulsar que, como decíamos, la compartición de datos no empiece desde cero.

 

"Gaia-X no viene a crear una nube europea sino a crear especificaciones para que luego los actores industriales de los diferentes estados miembros puedan crear proyectos de datos soberanos sobre dichos servicios"

 

Gaia-X tiene tres patas. Por un lado, la asociación europea, sin ánimo de lucro y que viene a determinar cómo podemos crear infraestructuras federadas de datos que garanticen que se puedan compartir datos a gran escala y propiciar una soberanía tecnológica que rompa esos sistemas monolíticos tecnológicos que limitan enormemente. Por otro, la comunidad de desarrollo, impulsada por algunos gobiernos como Alemania y Francia, que crea los componentes necesarios que articulan esas especificaciones. Y, finalmente, los hubs nacionales (como el español) que en muchos casos están esponsorizados por los gobiernos, pero constituidos por empresas privadas.

Es en estos últimos donde se erige el desarrollo de mercado. Se pretende la incubación de un ecosistema nacional de organizaciones que colaboren en torno al framework técnico de Gaia-X (especificado por la asociación, y desarrollado por la comunidad), para ofrecer servicios de datos (market services) sobre los que desarrollar proyectos sectoriales y aplicaciones data driven. Digamos que la asociación Gaia-X no viene a crear una nube europea sino a crear especificaciones para que luego los actores industriales de los diferentes estados miembros puedan crear proyectos de datos soberanos sobre dichos servicios. 

 

¿Y cómo pueden colaborar el sector público y el privado para acelerar la economía del dato en España?

Ese modelo de colaboración público-privada es el mecanismo bajo el que se diseñan la mayoría de estas iniciativas de espacios de datos. Por dos razones: primero porque existe una directriz política y estratégica a nivel europea de impulsar la economía del dato y hacerlo bajo la premisa de la soberanía digital.  La concienciación sobre la importancia de los datos está in crescendo. Las predicciones para 2025 estiman que en la economía digital europea entre el 50% y el 70% de los productos y servicios dependerán de los datos; sin embargo, más del 70% de las cadenas de valor tendrán flujos de datos inconexos y esto implica incurrir en fuertes ineficiencias que limitan la explotación del valor latente en los datos. 

Así mismo, se estima que el mercado de proveedores europeos de servicios nube esté por debajo del 10% (no ya mundialmente, sino dentro de la propia Unión Europea). Claramente esto supone un gran riesgo, pues no debemos afianzar nuestra apuesta por el dato solamente sobre capacidades tecnológicas externas. Para ello, y puesto que la ventaja competitiva de otras regiones en materia cloud es evidente, la propuesta desde Europa consiste en un cambio paradigmático: en lugar de un gran proveedor de nube monolítico que compita cara a cara, se aspira a una federación de proveedores de medianos y pequeños servicios en nube. Además, este modelo federado tiene una extensibilidad natural a la capa de datos, de modo que dota al usuario no sólo de mayor flexibilidad, sino también de una mayor disponibilidad de fuentes de datos, y activa a un ecosistema dinámico que rápidamente casa demanda con oferta, dando forma a un “mercados de datos y servicios de datos”. Como es natural, se espera que la mayor parte de la oferta en dicho mercado la aporte la actividad privada.

La segunda razón es la variedad de agentes y perspectivas que se hacen necesarias para dar forma a dicha economía del dato. La cadena de transformación del dato es compleja, e incluye desde infraestructuras hardware, software, acuerdos organizativos para la gestión, modelos de datos, así como algoritmos y otros artefactos para extraer valor de los mismos. Una vez más, se hace necesaria una colaboración público-privada para llevarlo a buen puerto. Un ejemplo claro es la iniciativa Gaia-X de la que antes hablábamos.

 

"Con el modelo de federación de proveedores de nube medianos y pequeños Europa propone un cambio paradigmático, un modelo que tiene una extensibilidad natural a la capa de datos"

 

¿Qué sectores se beneficiarán más en España de disponer de una estrategia del dato coordinada y gobernada?

El valor del dato es transversal a lo largo y ancho de los sectores productivos. El dato es un ingrediente basal, que sirve para representar las entidades con que nos manejamos en el día a día, así como sus relaciones y procedimientos. A través de dicha capacidad representacional se crean modelos simplificados, que después se conjugan entre sí para solucionar problemas complejos. Es decir, existe una cadena transformativa bajo la que los datos, en base a un contexto o hipótesis, se examinan e industrializan para generar información de relevancia lógica humana; suele decirse que existe un proceso que permite pasar de datos (entendidos como una colección de registros) a información y conocimiento, y en última instancia a ‘sabiduría’. Por ello, realmente todos los sectores pueden verse beneficiados del gobierno, gestión y explotación de los datos, y ésta es la razón por la que es una disciplina que ha resurgido con tanta fuerza en la última década.

Dicho esto, los sectores donde los espacios federados de datos pueden generar un mayor impacto son aquellos con procesos susceptibles a una modelización en base a fuentes de datos de carácter heterogéneo. En otras palabras, la modelización (de un determinado proceso sectorial) en base a datasets de diferentes disciplinas o ámbitos, bajo semánticas o codificaciones diferentes, o con una frecuencia de producción o granularidad muy heterogénea, resulta un proceso complejo, no sólo desde el punto de vista técnico, sino sobre todo organizativo.

Este tipo de escenarios son idóneos para probar y explotar los paradigmas de espacios de datos. Por ejemplo, el turismo es una industria donde hay una fuerte interrelación entre diferentes dominios, ya que está constituido por actividades privadas desarrolladas en espacios públicos. Esto supone, en primer lugar, que una gran parte de la tarea de modelización de procesos consiste en identificar actores, entender sus incentivos, y caracterizar sus fuentes de datos, para luego poder relacionarlas entre sí. Esto no resulta una tarea sencilla, fruto de la naturaleza distribuida y diversa de sus stakeholders. Sin embargo, en el lado positivo, el potencial de creación de valor es inmenso, ya que se trata de un campo todavía por explotar. A través de la digitalización y los datos, y de la mano de vehículos como los data spaces (paradigmas innovadores con que mitigar las dificultades propias de entornos federados), creemos que existen grandes oportunidades por aprovechar.

 

Por cierto, ¿es muy complejo coordinar una estrategia de datos en una España distribuida en 17 comunidades y dos ciudades autónomas? ¿Y qué podemos aprender de la gestión de los datos durante la pandemia realizada por el sector sanitario en este sentido?

Creo que el mayor aprendizaje de la gestión de datos durante la pandemia ha sido la importancia de contar con datos armonizados, generados en base a modelos comunes interoperables, y con un granularidad y un refresco homogeneizado, porque, si no, se corre el riesgo, en el mejor de los casos, de que no se puedan cruzar entre sí y contextualizar y, por ende, no se puedan usar provechosamente, y, en el peor, de que estemos interpretando información incorrectamente y tomando decisiones sobre bases equivocadas. 

Esta capa de datos armonizados es la parte más abstracta de lo que se denomina como “infraestructura de datos”, un nivel de conceptualización por encima de la capa física del hardware o de la capa de herramientas y software, y que se corresponde a unas capacidades (tecnológicamente neutrales) con que cumplir requisitos funcionales y no funcionales como la encontrabilidad de conjuntos de datos, su interoperabilidad, portabilidad, seguridad y privacidad, así como la flexibilidad y soberanía en el proceso de intercambio —y en última instancia de explotación— de datos. Estos criterios toman forma en torno al concepto de espacio de datos que, lejos de ser una infraestructura vertical monolítica, es la suma de acuerdos de facto en distintos dominios interoperables con que proveer de uniformidad y consonancia en los datos. Es justo la faceta donde se sitúa la Oficina del Dato, que surge para apoyar el despliegue de espacios de datos tanto a nivel de la Administración General del Estado, como de las industrias privadas.

 

"El mayor aprendizaje de la gestión de datos durante la pandemia ha sido la importancia de contar con datos armonizados, generados en base a modelos comunes interoperables, y con un granularidad y un refresco homogeneizado"

 

En el contexto de datos públicos, la coordinación administrativa se produce en el seno de la Comisión Sectorial de Administración Electrónica, donde también se armonizan otras materias en tecnologías de la información. En ella se buscan sinergias y puntos de encuentro entre las actividades llevadas a cabo por las autonomías y las desarrolladas desde la AGE. Por un lado, se entiende que el impulso, los recursos, y sobre todo la experiencia de las administraciones regionales (con conocimiento de sus respectivos territorios) son valores provechosos con que obtener capilaridad en el desarrollo de iniciativas de datos. Sin embargo, ese carácter regional no debe obstruir la identificación de normas y compromisos comunes con que armonizar dichas actuaciones individuales, precisamente porque estos compromisos sirven para vencer barreras y reticencias en la compartición y explotación de datos a una escala mayor.

El dato es un recurso no-rival, es decir, no se gasta al usarlo, permite ser usado concurrentemente en distintos escenarios, y –sobre todo– su utilidad aumenta al interrelacionarse con otros, en un claro “efecto de red”. Para capitalizar esta última característica surgen los espacios federados de datos, como mecanismos innovadores con que impulsar la economía del dato.

 

La aproximación de Europa en lo que respecta a la gestión de los datos y su protección es muy diferente a la de otros países con normativas más laxas como Estados Unidos o los países asiáticos. ¿Cree que tener una legislación fuerte en protección de datos y en el uso ético de los mismos (y de los algoritmos de la IA) nos beneficia o supone, en cierto modo, un freno para crecer en la economía del dato?

Lo siento pero no puedo atender esta pregunta, dado que tiene connotaciones que sobrepasan el ámbito competencial de la Oficina del Dato.

 

"La efervescencia en el desarrollo de CPD y equipamientos innovadores es un catalizador de la economía del dato"

 

Finalmente, grandes jugadores del ámbito de los centros de datos y del mundo cloud están apostando por España abriendo nuevos centros y regiones de nube. ¿Qué supone para la economía del dato española este tipo de iniciativas?

Efectivamente, actualmente hay una gran actividad en torno a la industria del centro de procesamiento de datos (CPD) en España. Este tipo de iniciativas representan la parte relativa al hardware y la comunicación, dentro de la cadena de transformación del dato. Hoy en día, la dependencia en la digitalización de la sociedad y la economía es tan alta que durante la pandemia se trató a los trabajadores de este tipo de centros como “personal esencial”, algunos servicios recibiendo incluso la calificación de “infraestructura crítica” del país. Esto es debido a que una parte importante de los procesos operativos de los sectores productivos se encuentran ya informatizados e interconectados, y, por ende, los propios productos y servicios dependen de esas capacidades digitales para su ejecución con seguridad y normalidad.

Además, en relación con la analítica de grandes volúmenes de datos, es importante resaltar que la extracción del valor latente en los mismos también correlaciona directamente con la disponibilidad y la flexibilidad de infraestructuras innovadoras. De cara a los avanzados propósitos que se aspira a obtener de los espacios federados de datos, se debe disponer de herramientas y capacidades que vertebren la interoperabilidad entre estos data spaces paneuropeos. Para ello, la interconexión de infraestructuras es un punto clave, de forma que se eviten silos y una fragmentación heredada ya desde la capa del metal.

Además, distintos escenarios analíticos prescriben diferentes arquitecturas TIC óptimas con las que maximizar los recursos y el tiempo de computación. Por ello, se quiere fomentar el reequilibrio gradual entre una infraestructura de datos centralizada on cloud versus el tratamiento distribuido en el borde, o incluso on device. Ese deseado continuo informático ininterrumpido, con el que sacar rédito de los espacios de compartición y explotación de datos, y desplegado sobre una colección de infraestructuras federadas, se sustenta en una generación moderna de servicios de ultraconectividad escalable, maleable y resiliente. Es por ello que esta efervescencia en el desarrollo de CPD y equipamientos innovadores es un catalizador de la economía del dato.

 


TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS