Actualidad
Redes Sociales

IIC y CIE usan Big Data y Procesamiento de Lenguaje Natural para buscar neologismos en Twitter

El español hablado en Twitter en España servirá de fuente del estudio para detectar los neologismos que el Instituto de Ingeniería del Conocimiento (IIC) y el Centro Internacional del español, organismo que pertenece a la Universidad de Salamanca, a través del acuerdo de colaboración firmado por ambas entidades, utilizarán para incluir nuevas palabras en el diccionario español.

El IIC  ADIC  y el CIE
Mariano Esteban, vicerrector para la celebración del VIII centenario de la Universidad de Salamanca y Alberto Barrientos (CEO del IIC) han sido los encargados de sellar el convenio.

El IIC – ADIC (Instituto de Ingeniería del Conocimiento - Asociación para el Desarrollo de la Ingeniería del Conocimiento) y el CIE (Centro Internacional del Español), organismo que pertenece a la Universidad de Salamanca, han firmado  un acuerdo para la búsqueda de neologismos en el español actual. Mariano Esteban, vicerrector para la celebración del VIII centenario de la Universidad de Salamanca y Alberto Barrientos (CEO del IIC) han sido los encargados de sellar el convenio para detectar nuevos términos en uso a través de Twitter e introducirlos en el diccionario.

Para llevar a cabo la investigación, el IIC aplicará tecnologías Big Data y de Procesamiento de Lenguaje Natural. A través de esta aplicación se realizarán las labores de búsqueda en la red de microblogging para encontrar que palabras se están utilizando actualmente en el español de España y no están recogidas en los  diccionarios de uso actuales.

Una vez realizado el proceso de investigación de campo en la red social, el IIC seleccionará los términos que pueden pasar a considerarse neologismos por su uso contrastado entre los usuarios de Twitter. El CIE será el encargado de validar estas palabras y decidir en última instancia si serán incorporados o no al diccionario de léxico no estándar.  

Normalmente, los lexicógrafos, las personas encargadas de validar los neologismos, deciden incorporar el nuevo término cuando éste aparece en fuentes de referencia prestigiosas. Sin embargo, en el nuevo proyecto este proceso se realizará desde una perspectiva sociolingüística al tener como base Twitter. Se trata de un estudio en profundidad de léxico español semicoloquial no estándar.

Antonio Moreno, investigador senior del IIC y director del Laboratorio de Lingüística Informática de la UAM, explica que este acuerdo supone un gran paso para la actualización de los diccionarios de español, “ambas instituciones iremos de la mano para encontrar neologismos en nuestro idioma siempre desde una perspectiva sociolingüística. Twitter es el medio más indicado para detectar la innovación lingüística por el contexto espontáneo e inmediato en el que se desenvuelve”.

Por su parte, Julio Borrego Nieto quien liderará la investigación por parte del CIE ha comentado que este proyecto tendrá además “un gran valor para los estudiosos de la lengua española en esta primera fase sobre el español peninsular y posteriormente sobre el español global”.  



TE PUEDE INTERESAR...

CASOS DE ÉXITO

Accede a nuestra publicación de canal

DealerWorld Digital

Documentos ComputerWorld

Documento Pure Storage y Kyndryl INFRAESTRUCTURAS