El pasado, presente y futuro de la traducción automática

¿Es realmente traducción automática neuronal frente a grandes modelos de lenguaje? ¿Podemos tener lo mejor de ambos mundos?

Flitto
Laboratorio de datos de Flitto
Fuente de la imagen: Unsplash

Cuando la traducción automática neuronal (NMT) se introdujo por primera vez en el mercado en 2016, fue un verdadero avance tecnológico. Hasta ahora, se erige como una de las formas más avanzadas de tecnología de traducción.

Traducción automática neuronal versus traducción automática estadística

Como sugiere su nombre, lo que distingue a la traducción automática neuronal es su capacidad para imitar el mecanismo del cerebro humano. Es capaz de comprender cómo algunas palabras son más similares entre sí que otras y tener en cuenta la oración completa al generar traducciones.

Hasta la aparición de NMT, la traducción automática estadística (SMT) era el modelo predominante de traducción automática. A diferencia de los modelos NMT, SMT solo podía digerir pocas palabras a la vez al traducir oraciones, lo que resultaba en traducciones literales o incómodas. Además, los sistemas que componen los modelos SMT carecían de interdependencia, lo que limitaba su flexibilidad en su conjunto.

¿Traducción automática neuronal frente a “IA generativa”?

Hace unos meses, las capacidades de ChatGPT en el procesamiento del lenguaje humano, incluida la traducción, hicieron un explosivo debut viral y tomaron la escena por asalto.

Con la aparición de chatbots multifuncionales como ChatGPT y Bard en el mercado, la «IA generativa» se ha convertido gradualmente en un nombre más familiar. Esto ha causado una posible idea errónea (o un nombre inapropiado) de que la IA generativa era la gran nueva tecnología para amenazar, o incluso reemplazar, los modelos de traducción automática neuronal.

Sin embargo, es importante tener en cuenta que la traducción automática neuronal es, después de todo, una forma de IA generativa por definición. Funciona con mecanismos y funciones de aprendizaje profundo en conjuntos de datos masivos para calcular los resultados por probabilidad y adecuación. Este es el mismo mecanismo que utilizan los modelos de IA generativa basados ​​en chatbots, ya que generan «respuestas» en lugar de traducción. Cuando se le da un aviso (es decir, textos en el idioma de origen), el sistema NMT aprovecha los conjuntos de datos de capacitación existentes para predecir y generar nuevos resultados (es decir, textos en el idioma de destino).

En aras de la aclaración, puede ser más preciso analizar y discutir los modelos de traducción automática neuronal convencionales con traducción automática basada en modelos de lenguaje grande.

Similitudes entre NMT y traducciones basadas en LLM

Los sistemas de traducción automática, independientemente de sus formas y arquitecturas, aprovechan un tipo especializado de datos denominado cuerpos paralelos. Los corpus paralelos pertenecen a cadenas de datos de idiomas alineados con sus correspondientes traducciones en el idioma de destino. Estos corpus paralelos son los componentes básicos de los sistemas de traducción automática, ya que proporcionan ejemplos de cómo cada palabra se relaciona con sus contrapartes multilingües y permiten que los sistemas utilicen ese conocimiento en la traducción.

Ejemplo de cómo pueden verse los datos de corpus paralelos

Tanto el sistema de traducción automática neuronal como el modelo de lenguaje grande utilizan este tipo de datos al realizar tareas de traducción. Esto significa que sus funcionalidades pueden potenciarse e inhibirse con problemas similares a nivel de datos:

  • Conjuntos de datos de corpus paralelos más diversos, precisos y ricos significan mejores capacidades de traducción.
  • Existe una disparidad en las calidades de salida entre los lenguajes de recursos altos y bajos debido al desafío inherente de asegurar corpus paralelos entrenables.
  • Según los dominios o las tareas, sus conjuntos de datos pueden ajustarse para ofrecer resultados de traducción más específicos.

Se pueden crear conjuntos de datos de corpus paralelos a través de varias fuentes. Es común idearlos utilizando documentos o sitios web multilingües. Sin embargo, este tipo de fuentes pueden estar sujetas a derechos de autor o cuestiones éticas, por lo que es importante proceder con precaución. Para dominios o idiomas personalizados, también es posible recopilar y refinar corpus paralelos personalizados de acuerdo con lo que sea necesario para el motor.

A continuación, veamos las diferencias entre las dos herramientas de traducción.

Traducción automática neuronal frente a traducción basada en modelos de lenguaje extenso

Hemos establecido que los sistemas de traducción automática neuronal autónomos y la traducción basada en modelos de lenguaje grande utilizan mecanismos similares, así como también tipos de datos superpuestos durante los procesos de traducción. Si es así, ¿por qué la gente empezó a comparar la traducción automática neuronal con los grandes modelos de lenguaje? ¿Es uno mejor que el otro? De ser así, ¿qué sistema deberíamos usar para obtener mejores resultados?

Los dos ofrecen distintas características y puntos fuertes. Los sistemas de traducción automática neuronal (NMT) son:

  • Diseñado únicamente con el propósito de llevar a cabo tareas de traducción;
  • Dominantemente entrenados de manera supervisada, lo que significa que los conjuntos de datos de entrenamiento han sido etiquetados apropiadamente (por ejemplo, corpus paralelos); y
  • A menudo capacitado para priorizar la evitación de producir resultados incorrectos (precisión> creatividad).

Mientras tanto, los modelos de lenguaje grande son:

  • Diseñado para realizar diversas tareas relacionadas con los idiomas, no limitadas a la traducción;
  • No se limitan a los métodos de aprendizaje supervisado durante el entrenamiento, lo que significa que pueden entrenarse con una gran cantidad de datos sin etiquetar, y los datos etiquetados comprenden solo una parte de los datos con los que están entrenados; y por lo tanto
  • Capaz de aprovechar datos de corpus no paralelos al producir resultados de traducción (lo que significa que hay más variables inesperadas).

Estas diferencias ofrecen opciones a los usuarios. Por ejemplo, los usuarios pueden optar por patrocinar NMT si requieren una traducción sencilla que requiera una mayor precisión. Por otro lado, los modelos de lenguaje grandes pueden ser útiles cuando los usuarios tienen espacio para la creatividad cuando se trata de resultados de traducción.

La calidad de la traducción también varía mucho entre los diferentes motores creados por diferentes empresas según el tamaño del conjunto de datos, la calidad y la estructura del modelo, que es otro factor a considerar.

Avanzando: síntesis de NMT y LLM

Además de la precisión y la fluidez, la relevancia y la puntualidad juegan papeles cruciales para lograr una buena traducción automática. Si bien la precisión garantiza que la traducción sea correcta y la fluidez garantiza que se lea sin problemas, la relevancia garantiza que la traducción se alinee con el significado y el contexto previstos del texto de origen, mientras que la puntualidad garantiza que las traducciones se entreguen a tiempo.

Para abordar las debilidades y mejorar el factor de relevancia en la traducción automática, es ideal un enfoque multifacético. Este enfoque combina las fortalezas de diferentes tecnologías de traducción, como la traducción automática neuronal (NMT) y los modelos de lenguaje extenso (LLM), para crear una herramienta de traducción más completa.

Al aprovechar las capacidades de NMT y LLM, los sistemas de traducción automática pueden beneficiarse de la precisión y el conocimiento del contexto de NMT y el conocimiento lingüístico diverso y la creatividad de LLM. Además, las actualizaciones periódicas en los conjuntos de datos de capacitación ayudarán a garantizar que los modelos de traducción se mantengan actualizados y reflejen los matices y el uso del lenguaje en evolución.

Ejemplo de la vida real de traducción automática sintetizada

El nuevo servicio de traducción de vanguardia de Flitto Flitto IA+ es un ejemplo de síntesis entre las dos tecnologías. El servicio de traducción único aprovecha NMT y LLM independientes y toma lo mejor de ambos mundos.

El motor NMT patentado de Flitto, que se actualiza periódicamente con conjuntos de datos de corpus paralelos de alta calidad recopilados y examinados en la plataforma de idiomas de Flitto con 13 millones de usuarios en todo el mundo, sirve como un mecanismo de ajuste eficaz para la fluidez avanzada similar a la humana habilitada por un gran modelo de idioma.

Una instantánea de la traducción de Flitto AI+

La plataforma resultante mostró potentes actuaciones. Flitto AI+, actualmente en su versión beta, obtuvo una puntuación de hasta un 41 % más alta que los sistemas NMT y LLM independientes existentes, según una encuesta a ciegas realizada entre lingüistas y profesionales del idioma. El resultado se mantuvo incluso en diversos dominios de texto de origen, como marketing, poesía y textos técnicos. Se destacó especialmente en la traducción de modismos y juegos de palabras.

Hacia adelante…

Tanto la traducción automática neuronal como los grandes modelos de lenguaje han transformado en gran medida el campo de la traducción automática. Si bien sus actuaciones se basan en conjuntos de datos de corpus paralelos, ofrecen distintas ventajas según los requisitos de traducción. La síntesis de estas tecnologías puede conducir a un mejor rendimiento de la traducción, ofreciendo precisión, fluidez, relevancia y creatividad en los resultados de la traducción automática.

Si bien la traducción automática no puede reemplazar a los traductores humanos ni a los minuciosos procesos de localización, puede ser una gran ayuda para los casos cotidianos en los que una traducción simple y precisa puede salvar el día.

Flitto DataLab ofrece soluciones en el ciclo de vida general de datos como servicio de los motores de traducción automática a través de corpus monolingües y paralelos listos para usar de alta calidad e incluso una colección personalizada de conjuntos de datos. Como empresa líder en soluciones de datos lingüísticos, esperamos participar en el avance de más tecnologías de vanguardia en el futuro.


Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *