Reduciendo barreras del lenguaje con Neural Machine Translation

redes neuronales

Algunos dicen que estamos en la economía de la post comunicación. Una economía en la que no hay barreras lingüísticas entre los agentes que interactúan en el mercado. La traducción automática basada en redes neuronales (Neural Machine Translation) está revolucionando el panorama de la traducción automática. Este elemento de innovación sin embargo no está exento de polémica. Conceptos como la economía de la post comunicación están lejos de ser una realidad aunque es seguro que acabarán llegando.

Como proveedores de tecnologías y servicios del lenguaje es nuestro deber arrojar luz en los aspectos más polémicos de nuestro sector. Los compradores de NMT deben conocer las limitaciones y ventajas concretas de esta tecnología para poder implementarla con total seguridad y optimizarla incrementalmente. De esta manera NMT puede proporcionar grandes incrementos de productividad en los esfuerzos de localización de cualquier empresa que aspire a una comunicación global. ¿Y quién no aspira a comunicarse con todo el mundo hoy en día?

¿Qué es Neural Machine Translation?

El adjetivo de neuronal (neural) viene de la tecnología que habilita los motores de NMT: las redes neuronales. Son modelos de aprendizaje automático basados levemente en la estructura de las neuronas de nuestro cerebro. Es una definición algo vaga pero sirve para representar los distintos niveles de nodos por los cuales se introducen datos (en este caso palabras en el idioma de origen) para obtener un resultado final muy afinado (palabras traducidas al idioma objetivo).

Las distintas capas de neuronas adjudican pesos y sesgos a los datos que le son introducidos para ponderar distintos resultados. La misma red neural es retroalimentada (back propagation) con los resultados elegidos mejorando así el proceso continuamente. El gran salto que ofrece NMT a tecnologías de traducción automática anteriores es que se lee menos como una máquina. Parece un avance un poco efímero pero no es así. Las mejoras en la fluidez del texto son fundamentales para que nuestro cerebro interprete que el texto lo ha generado un humano.

Las limitaciones principales vienen de la falta de cuerpos textuales bilingües que sirvan de ejemplo de buenas traducciones a los motores para ir entrenándolos. Aunque esa barrera ya empieza a romperse como han demostrado los investigadores de la Universidad del País Vasco Mikel Artetxe, Gorka Labaka, Eneko Agirre y KyungHyun Cho en esta investigación.

Cómo comunicarse globalmente con Neural Machine Translation

La vanguardia de la tecnología de traducción automática no es una varita mágica que traduzca instantáneamente todo lo que toque, sea un manual industrial de un reactor nuclear o una descripción de producto en una tienda online.

NMT es tanto una tecnología como un proceso de localización que las empresas han de internalizar. Existen infinidad de factores a considerar entre ellos los tupos de archivos, el tipo de contenido, la probabilidad de requerir ediciones o la frecuencia de publicación por mencionar solo algunos. Las combinaciones de lengua fuente y lengua destino también es otra variable a tener en cuenta aunque los motores de NMT cada vez traducen mejor en combinaciones poco frecuentes.

Dada nuestra dilatada experiencia en este campo con múltiple clientes corporativos hemos compilado un whitepaper. Hemos distribuido el camino a la excelencia en NMT en varios niveles con instrucciones claras y reproducibles en función de la madurez de nuestros clientes con tecnologías como NMT. Es sencillo extraer todo el jugo de una tecnología tan puntera como NMT si se sabe cómo.

Las enseñanzas principales de esta investigación son que la traducción automática gratuita pone en riesgo la confidencialidad de la información de las empresas. Uno de los activos fundamentales de cualquier empresa son los datos y estos deben de estar sometidos a las medidas de seguridad más estrictas, especialmente considerando la llegada de GDPR en mayo de este año. Por otro lado, existen procesos de creación de contenido que merece la pena implementar en la ideación del contenido que hará su localización vía NMT mucho más acertada y rápida. Son procesos de controlled language, entrenamiento de memorias de traducción, creación de glosarios…

En un momento como el actual en que las empresas deben dar soporte global, deben hacer social listening en múltiples idiomas, que tienen equipos globales en sus oficinas es fundamental tener preparado algún proceso que esté vitaminado por NMT. Creemos que la investigación que hemos hecho pública puede ayudar a entender mejor una compleja tecnología como NMT y sobre todo los resultados inmediatos y a largo plazo que cualquier empresa puede esperar de ello. 

 

Por Jordi Mon Companys, Product Marketing Manager Donnelley Language Solutions  



TE PUEDE INTERESAR...

Nuevo número de nuestra revista de canal 
 
DealerWorld Digital

 

Cobertura de nuestros encuentros

 

Documentos ComputerWorld



Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?