Inteligencia artificial
Amazon

La RAE y Amazon Web Services crean una herramienta de IA para analizar el español en internet

Hasta el momento, la plataforma cuenta con más de 8 millones de documentos de España y América, de fuentes digitales espontáneas (como redes sociales o foros) y periodísticas.

Inteligencia Artificial

Más de 8,7 millones de documentos ya han sido examinados con una nueva herramienta elaborada por la Real Academia Española (RAE) y Amazon Web Services (AWS) que analiza el uso del español en Internet a través de inteligencia artificial.

Se trata de un sistema que, con el objetivo de conocer y valorar el estado del español en el mundo, permite examinar en muy poco tiempo una gran cantidad de documentos de la web. Hasta el momento, la herramienta ha analizado documentos de España y los países hispanohablantes de América, provenientes de fuentes digitales en el que se utiliza un español espontáneo, como redes sociales, foros o marketplaces, y textos periodísticos que permitirán comparar las diferencias entre ambos tipos de lenguaje. 

El sistema, desarrollado a partir de las tecnologías nativas de la nube de AWS y con el asesoramiento de la RAE, está dividido en tres bloques: el estudio de extranjerismos, el análisis de la riqueza léxica y un radar de errores lingüísticos (que los identifica y clasifica como ortográficos, gramaticales, léxicos, de estilo y tipográficos).

Esta colaboración se enmarca dentro del proyecto Lengua Española e Inteligencia Artificial (LEIA), que busca utilizar la inteligencia artificial para velar por el uso del español dentro de los entornos digitales. Así, la herramienta de la RAE y AWS podrá permitir el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de IA.

 

¿Cómo funciona la herramienta?

El sistema sigue una arquitectura ‘sin servidor’, orientada a eventos y su proceso de análisis funciona en tres fases:

  • En una primera etapa, se indexan los documentos en Amazon OpenSearch Service, un sistema para proporcionar acceso rápido, análisis y búsqueda a volúmenes grandes de datos. Esto se hace mediante AWS Lambda, un servicio en la nube que permite ejecutar código sin aprovisionar ni administrar servidores. Las fuentes de datos, los resultados y métricas que van a ser procesados se almacenan en Amazon S3.
  • En la segunda fase, se obtienen métricas que caracterizan los textos de las distintas fuentes de datos atendiendo a distintos criterios, como el cálculo de estadísticas generales respecto a la variabilidad, frecuencia y riqueza del texto, así como el cálculo de errores mediante algoritmos de procesamiento de lenguaje natural.
  • Finalmente, la tercera etapa corresponde a la indexación de los resultados del análisis para su visualización e interacción por parte de los usuarios a través de filtros que actualizan los resultados en tiempo real.


Registro:

Eventos:

 

Partnerzones

Revistas Digitales

DealerWorld Digital

IDG Research

Documentos ComputerWorld