No toda traducción automática es posteditable (es decir, se puede corregir). Con frecuencia, es más costoso recomponer frases ininteligibles de un traductor automático que traducirlo directamente. Por ello han surgido programas y algoritmos para medir la calidad de la traducción.
La plataforma TAUS, importante think tank en el sector de investigación y servicios de traducción, ha publicado recientemente unas guías de buenas prácticas en la evaluación de la calidad según los siguientes criterios:
- Adecuación – ¿el texto traducido transmite la idea del texto original?
- Fluidez – ¿el texto traducido suena “natural” para un hablante nativo?
- Tipología de errores – evaluación de los errores clasificándolos en cuatro categorías: lenguaje, terminología, precisión y estilo.
A pesar de que diferentes estudios arrojan resultados muy dispares, coinciden al indicar que la precisión de los traductores automáticos todavía dista de la precisión de los traductores humanos expertos:
- Traducción manual (experto): superior al 95%.
- Traducción automática: entre un 30 y un 85%, en función de diversos factores que influyen en la calidad.
Factores que influyen en la calidad de la traducción automática
Extensión del corpus
Hay dos tipos de sistemas de traducción automática muy diferentes: los que se basan en *reglas lingüísticas* y los que crean un *modelo estadístico* a partir de corpus con gran cantidad de textos equivalentes en dos o más lenguas.
En los sistemas estadísticos, la calidad de la traducción depende de la extensión de ese corpus. Es el caso de Google Translate (un sistema estadístico), donde las traducciones del inglés o hacia el inglés tienen mejor calidad que las traducciones en otras combinaciones de lenguas más cercanas.
Calidad de Google Translate (según datos para un estudio publicado en 2011):
- Castellano > Inglés: 67 %
- Castellano > Catalán: 62 %
Cercanía de los idiomas
Ante corpus similares, los resultados suelen ser mejores entre lenguas de una misma familia (español-catalán) que entre lenguas distantes entre sí (español-inglés).
Calidad de N-II (modelo de traducción estadística de la Universitat Politècnica de Catalunya):
- Castellano > Inglés: 54 %
- Castellano > Catalán: 84%
Calidad del texto original
Los errores ortográficos en el texto original dan mala imagen y dificultan la traducción automática. Cuando leemos en nuestra propia lengua, tendemos a corregir mentalmente los errores para comprender el sentido. El traductor automático, en cambio, al encontrar una palabra mal escrita no sabe cómo interpretarla y es muy probable que la traduzca mal o incluso produzca una frase sin sentido.
Guiones entre palabras, símbolos poco frecuentes y signos de puntuación también afectan a la traducción. La traducción automática puede cambiar totalmente por unas comillas o por un punto mal puesto.
Ejemplo de texto cuyo significado cambia según la puntuación. ¿El preso cumplió la condena?
- Perdón imposible, que el preso cumpla su condena. – Sí
- ‘Perdón, imposible que el preso cumpla su condena. – No
Para garantizar una buena calidad, es recomendable que haya una preedición del texto. En esta fase se corrige cualquier error y se minimizan los signos innecesarios que podrían entorpecer la tarea del traductor automático.
Estilo lingüístico del texto original
Las traducciones automáticas son de mayor calidad en frases cortas y sencillas que en textos literarios llenos de juegos de palabras y dobles sentidos.
Estandarización del texto original
Algunos traductores automáticos se pueden personalizar y entrenar para mejorar los resultados. ¿Cómo?
Invirtiendo tiempo para perfeccionar las reglas lingüísticas
Aumentando el número de textos equivalentes para optimizar las predicciones estadísticas
Hay que tener en cuenta que para generar un modelo estadístico con resultados aceptables hay que disponer de un corpus con más de dos millones de palabras en cada lengua de la combinación lingüística.