Chat with us, powered by LiveChat

Proceso de Desarrollo de Traducción Automática Neuronal Personalizada

Para lanzar un nuevo motor de traducción automática neuronal personalizada (CNMTE), Trusted Translations requiere un período inicial de capacitación y configuración. El siguiente es un proceso típico de implementación para desarrollar un nuevo motor de NMT.

Seleccionar un motor de referencia

Se está desarrollando un montón de contenido sobre democratización de algoritmos. Sin embargo, este concepto debería ser más integral. Por ejemplo, la democratización de las soluciones tecnológicas comienza a hacer que los motores de referencia sólidos sean una buena base sobre la cual armar una solución personalizada. Las ofertas de servicio de Google, Microsoft o Amazon ayudarán a alimentar sus propios datos limpios en motores que ya están bien capacitados.

Selección de datos y preparación de grupos de textos

Existen varios abordajes para recoger datos de capacitación para armar un motor personalizado.

  • Contenido traducido existente:

    El punto de partida ideal para cada motor de traducción automática neuronal personalizada es buscar y utilizar material ya traducido que incluya contenido lo más similar posible a lo que se traducirá. Mientras más material ya traducido haya, más rápido y económico será el proceso. Si el origen y el destino no están asociados como unidades de memoria de traducción, se puede realizar una alineación para obtener el contenido bilingüe necesario para estimular el desempeño del motor.

  • Datos monolingües existentes:

    Si existen cantidades suficientes de contenido de referencia de destino, se lo puede agregar a la mezcla para aprovechar todo el estilo y la terminología. Es probable que este contenido lo hayan desarrollado de cero pequeñas empresas locales, y su valor es insuperable. No hace falta decir que la terminología específica del dominio o incluso del cliente es un recurso excelente cuando se personalizan motores basados ​​en la tecnología NMT, en los que se identifica la terminología como su principal debilidad.

  • Creación de un grupo de textos especializados de otras fuentes:

    Además de utilizar datos monolingües, buscaremos en internet material que esté lo más estrechamente alineado posible con el contenido que correrá por el motor. Lo repetimos: siempre da buenos resultados invertir tiempo en la búsqueda de los grupos de texto de la mejor calidad. Lo mismo se aplica a datos bilingües que se pueden obtener de mercados de datos. Esos datos externos paralelos deberán limpiarse (se debe corregir la ortografía, revisar las alineaciones, detectar duplicados, etc.) antes de que se los use para capacitación de un sistema de MT. Se requiere gran cantidad de participación manual en esa situación en comparación con si el cliente puede entregar desde el principio cantidades suficientes de datos alineados de alta calidad. Tomará de 4 a 6 semanas construir el nuevo motor.

Mientras se posedita cada vez más material, se lo puede convertir en datos de perfeccionamiento de alta calidad. Este modelo flexible hará que la calidad del producto del sistema mejore bastante rápido con el tiempo.

Perfeccionamiento: Los CNMTE Nuevos Mejoran con la Posedición Humana

Existen diversos flujos de trabajo que involucran motores de traducción automática neuronal personalizada. Una configuración común es integrar un proceso de posedición humana. En este flujo de trabajo, nuestros lingüistas expertos editan el producto del motor de traducción automática personalizada para mejorar la calidad del producto actual, además de perfeccionar el motor para futuras traducciones. Mientras el revisor modifica el producto para mejorar su calidad, el motor se vuelve más inteligente con el uso de un modelo dinámico flexible. Además, a medida que fluyen más traducciones por él, el motor se vuelve más inteligente con el tiempo. En otras palabras, la brecha de calidad entre una traducción humana completa y esta solución se achica de manera drástica, en tanto que el tiempo de entrega y los costos se reducen significativamente. Estos motores, en nuestra opinión, se convertirán en un recurso y un diferenciador de mercado para cualquier cliente con tal necesidad.