Proceso de Desarrollo de Traducción Automática Personalizada

Con el objeto de lanzar un nuevo motor de Traducción Automática Personalizada, Trusted Translations requiere un período de entrenamiento y configuración inicial.

El siguiente es un proceso de implementación típico para desarrollar un nuevo motor de traducción automática a medida

Personalización de Nuevos Motores de traducción automática para Cada Par de Idiomas

Los datos de entrenamiento necesarios para desarrollar un motor de calidad dependen en gran medida de las especificaciones técnicas del tipo de dominio de contenido. Por lo tanto, las muestras del contenido existente serán extremadamente útiles para desarrollar datos de entrenamiento relevantes, y por consiguiente, un motor de alta calidad para cada par de idiomas. Hay diversas opciones disponibles para reunir datos de entrenamiento con el fin de desarrollar un motor personalizado.

  • Material Traducido Existente:

    El punto de partida ideal para cada motor de traducción automática personalizada es encontrar y utilizar el material previamente traducido que incluye contenido que es muy similar a lo que se desea traducir. Mientras más material traducido previamente haya, menos costoso y más rápido será el proceso.

  • Datos Monolingües Existentes:

    Si existen suficientes cantidades de contenido de origen, es posible extraer oraciones limpias, monolingües que nuestros expertos puedan traducir. Al crear un conjunto de datos paralelos para cada par de idiomas, podemos crear el contenido apropiado a partir del cual se desarrollará y entrenará un motor personalizado.

  • Creación de un Cuerpo Especializado a partir de otras fuentes:

    Además de utilizar datos monolingües, buscaremos en la Web para ver si hay material que esté estrechamente alineado con el contenido que se ejecutará en el motor. Ya que nuestros motores son de naturaleza estadística, necesitaremos buscar datos paralelos y monolingües. Inicialmente, desarrollaremos sistemas usando los datos proporcionados por el cliente junto con los datos complementarios obtenidos de la Web para demostrar la eficacia de este enfoque.

    Los datos paralelos encontrados en la Web deberán limpiarse (corregir la ortografía, revisar las alineaciones, detectar los duplicados, etc.) antes de convertirse en datos de entrenamiento para un sistema de traducción automática. Se requiere una gran cantidad de participación manual en ese escenario en comparación con uno donde el cliente puede entregar desde el principio cantidades suficientes de datos alineados de calidad. Tomará de 4 a 6 semanas desarrollar el nuevo motor.

A medida que se posedita más y más material, se lo puede convertir en material de entrenamiento de calidad. Por lo tanto, la calidad del sistema mejorará rápidamente con el tiempo.

Los Nuevos Motores de traducción automática Personalizados mejoran con la Posedición Humana

Existen diversos flujos de trabajo que involucran un Motor de Traducción Automática Personalizada. Una configuración común es integrar un proceso de posedición humana. En este flujo de trabajo, el producto del Motor de Traducción Automática Personalizada es editado por uno de nuestros lingüistas expertos a fin de mejorar la calidad del resultado actual así como volver a entrenar al motor para futuras traducciones. Mientras el editor modifica el resultado para mejorar la calidad, el motor se vuelve más inteligente. A medida que más traducciones pasan por el motor, más inteligente se vuelve. Con el tiempo, la brecha de calidad entre una traducción completamente humana y esta solución se reducirá en gran medida. Además, el tiempo y los costos de ejecución se reducirán significativamente. Estos motores, en nuestra opinión, se convertirán en un activo y un diferenciador de mercado para cualquier Cliente con una necesidad de este tipo.