Educación | Noticias | 02 NOV 2017

IIC y CIE usan Big Data y Procesamiento de Lenguaje Natural para buscar neologismos en Twitter

El español hablado en Twitter en España servirá de fuente del estudio para detectar los neologismos que el Instituto de Ingeniería del Conocimiento (IIC) y el Centro Internacional del español, organismo que pertenece a la Universidad de Salamanca, a través del acuerdo de colaboración firmado por ambas entidades, utilizarán para incluir nuevas palabras en el diccionario español.
El IIC  ADIC  y el CIE
Mariano Esteban, vicerrector para la celebración del VIII centenario de la Universidad de Salamanca y Alberto Barrientos (CEO del IIC) han sido los encargados de sellar el convenio.
Redacción

El IIC – ADIC (Instituto de Ingeniería del Conocimiento - Asociación para el Desarrollo de la Ingeniería del Conocimiento) y el CIE (Centro Internacional del Español), organismo que pertenece a la Universidad de Salamanca, han firmado  un acuerdo para la búsqueda de neologismos en el español actual. Mariano Esteban, vicerrector para la celebración del VIII centenario de la Universidad de Salamanca y Alberto Barrientos (CEO del IIC) han sido los encargados de sellar el convenio para detectar nuevos términos en uso a través de Twitter e introducirlos en el diccionario.

Para llevar a cabo la investigación, el IIC aplicará tecnologías Big Data y de Procesamiento de Lenguaje Natural. A través de esta aplicación se realizarán las labores de búsqueda en la red de microblogging para encontrar que palabras se están utilizando actualmente en el español de España y no están recogidas en los  diccionarios de uso actuales.

Una vez realizado el proceso de investigación de campo en la red social, el IIC seleccionará los términos que pueden pasar a considerarse neologismos por su uso contrastado entre los usuarios de Twitter. El CIE será el encargado de validar estas palabras y decidir en última instancia si serán incorporados o no al diccionario de léxico no estándar.  

Normalmente, los lexicógrafos, las personas encargadas de validar los neologismos, deciden incorporar el nuevo término cuando éste aparece en fuentes de referencia prestigiosas. Sin embargo, en el nuevo proyecto este proceso se realizará desde una perspectiva sociolingüística al tener como base Twitter. Se trata de un estudio en profundidad de léxico español semicoloquial no estándar.

Antonio Moreno, investigador senior del IIC y director del Laboratorio de Lingüística Informática de la UAM, explica que este acuerdo supone un gran paso para la actualización de los diccionarios de español, “ambas instituciones iremos de la mano para encontrar neologismos en nuestro idioma siempre desde una perspectiva sociolingüística. Twitter es el medio más indicado para detectar la innovación lingüística por el contexto espontáneo e inmediato en el que se desenvuelve”.

Por su parte, Julio Borrego Nieto quien liderará la investigación por parte del CIE ha comentado que este proyecto tendrá además “un gran valor para los estudiosos de la lengua española en esta primera fase sobre el español peninsular y posteriormente sobre el español global”.  

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información