Volume 14, No. 4 
October 2010

 
  María José Fernández Pintelos


 
 

Front Page

 
 
Select one of the previous 53 issues.

 
Index 1997-2010

 
TJ Interactive: Translation Journal Blog

 
  Translator Profiles
Chance Favors the Prepared Mind
by Patricia Thickstun
 
Interview with ATA Board Candidate Ted Wozniak
by Linda Marianiello

 
  The Profession
The Bottom Line
by Fire Ant & Worker Bee
 
How to Drive Your Translators Crazy without Really Trying
by Danilo Nogueira and Kelli Semolini

 
  In Memoriam
In Memoriam: Derry Cook-Radmore
by Nick Rosenthal

 
  Translation Nuts and Bolts
English Translation of Chinese Dish Names
by Congjun Mu
 
A Model of Translation Based on Proverbs and Their Metaphors: A Cognitive Descriptive Approach
by Freeda C. Wilson
 
Un modèle de traduction basé sur les proverbes et leurs métaphores : Une position cognitive descriptive
Freeda C. Wilson

 
  Science and Technology
Conseils de base pour la gestion de la terminologie industrielle
M.L. Seren-Rosso

 
  Medical Translations
Comparison of Textual Patterns in German and Portuguese Medical Texts
by Katrin Herget and Teresa Alegre

 
  Cultural Aspects of Translation
A Study of Euphemisms from the Perspectives of Cultural Translation and Linguistics
by Behnaz Sanaty Pour

 
  Arts and Entertainment
Tonality in Subtitle Translation
by D. Bannon
 
English-into-Persian Translation of Colloquial Expressions in Subtitled Films
by Hossein Barzegar

 
  Translators' Education
Traducción automática y software libre en la formación de traductores
María José Fernández Pintelos

 
  Book Reviews
Agop Hacikyan's A Summer without Dawn
reviewed by Hasmik Najaryan
 
Desarrollo de la competencia traductora de Silvia Roiss
Reseñado por Dra María José Varela Salinas
 
Dictionary of Leisure, Travel and Tourism por Bateman, H., Harris, E. y Mc Adam, K.
Reseñado por Concepción Mira Rueda

 
  Translators' Tools
Translators’ Emporium

 
  Caught in the Web
Web Surfing for Fun and Profit
by Cathy Flick, Ph.D.
 
Translators’ On-Line Resources
by Gabe Bokor
 
Translators’ Best Websites
by Gabe Bokor

 
Call for Papers and Editorial Policies
  Translation Journal
Translator Education
 

Traducción automática y software libre

en la formación de traductores

María José Fernández Pintelos
Departamento de Traducción y Lingüística
Universidad de Vigo

 

Esta comunicación se inscribe en el proyecto PGIDIT07PX1B302200PR (Xunta de Galicia)


Resumen:

Tras un análisis de la formación tecnológica de los estudiantes de traducción se describe el proceso de traducción automática y se compara con la traducción humana. A continuación se consideran las situaciones profesionales para las que este tipo de traducción resulta útil. Después de enumerar los tipos de traducción automática se mencionan algunos ejemplos de traductores automáticos libres. Finalmente se concluye que la traducción automática ha alcanzado unos niveles aceptables de calidad y que pueden ser útiles para los traductores profesionales de determinados tipos de textos y para los docentes y alumnos de Traducción.

Palabras clave: traducción automática, traducción humana, software libre, traducción, formación de traductores


Abstract:

After an analysis of the technological training of translation students, machine translation is described and compared with human translation. Then, the professional situations for which this kind of translation is useful are considered. After enumerating the types of machine translation, some examples of free machine translation systems are listed. The final conclusion is that machine translation has achieved acceptable quality levels and can be useful for professional translators working with certain types of texts and also for Translation teachers and students.

Key words: machine translation, human translation, free software, translation, training of translators

 

Estado de la cuestión

a formación de traductores debe incluir entrenamiento de habilidades técnicas, además de las destrezas lingüísticas y terminológicas. En efecto, las nuevas exigencias de calidad y eficiencia en el trabajo han requerido de los traductores una familiaridad cada vez mayor con la tecnología.

Por ello, los alumnos de Traducción e Interpretación necesitan ser instruidos en el uso de herramientas informáticas, pero también en los criterios para su selección. Como he podido comprobar en un estudio realizado a lo largo de cuatro años de docencia (Fernández Pintelos, 2010), los alumnos asimilan en mayor o menor medida los conocimientos sobre estos instrumentos tecnológicos, pero tienden a no emplear tiempo en su manejo. De hecho, los alumnos suelen posponer tanto el aprendizaje de nuevos instrumentos de apoyo a su trabajo como la práctica de los que ya le son conocidos.

It is clearly essential for future translators to learn to use the available translation technology, but [...] the process needs to focus not just on the ability to use the technology, but also on encouraging a good understanding of the objectives, possibilities and limitations of the technology itself. (Maia, 2008)

En particular, la competencia técnica de los futuros traductores suelen obviar la determinación de criterios para la toma de decisiones en cuanto a las técnicas de revisión de textos y de traducción automática, habilidades que se exigen cada día más en el mercado de la traducción profesional.

Los alumnos de Traducción suelen tener también dificultades en el ejercicio la autocrítica y la crítica de traducciones. Estas dificultades se ven parcialmente superadas cuando los ejemplos son de traducciones automáticas.


Traducción automática

La traducción automática es un área de la Lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. Desde su nacimiento ha sido objeto de numerosos experimentos y cuantiosas inversiones por parte de instituciones y empresas, y de desprecio por parte de profesionales y estudiantes de traducción. Todo ello se deriva de las pretensiones de sustitución del traductor humano con las que fueron creadas las primeras herramientas de traducción automática.

No es difícil encontrar una mala traducción producto de un procesado automático del texto original, si bien a menudo los resultados son comparables traducciones hechas por personas en condiciones de trabajo insostenibles o traductores humanos que escriben en un idioma que no es su lengua materna.

Desde Warren Weaver, el padre de la traducción automática, se abordó la lengua como si fuese un oscuro «código» formado por un léxico y una gramática que, introducidas en una máquina servirían para traducir de un «código» a otro. Siguiendo esta concepción chomskyana de la lengua, los traductores automáticos, basados en diccionarios bilingües, no llegaron a satisfacer las expectativas que se habían creado.


Traducción automática y traductor humano

La dirección predominante en la evolución del software para traducción automática es la de herramientas que mejoren la productividad del traductor, en particular con textos técnicos muy repetitivos.
La traducción se entiende como un fenómeno lingüístico-cultural cimentado en el análisis del discurso y en la teoría funcionalista de la traducción. El proceso comienza con el análisis de los textos de trabajo (considerando siempre la orden de traducción) y la selección de la estrategia de traducción más adecuada. Sólo así se obtendrá una traducción que cumpla con las exigencias de la situación comunicativa, en función de la intención de la traducción y de sus destinatarios (Bühler, 1965; Reiss, 1983 y Nord, 1988).

Los lenguajes humanos constan de morfología (la forma en que pequeñas unidades provistas de significado construyen las palabras), sintaxis (la estructura de una frase) y semántica (el significado). Se ha de ser capaz de reconocer todas las palabras de una frase y la influencia que tienen las unas sobre las otras, resolver las ambigüedades y considerar el estilo y las cuestiones pragmáticas del texto.

Decisivo será también el grado de especialización del texto, que se reflejará en sus características lingüísticas y retóricas, como el grado de simplificación terminológica y sintáctica o el uso de la redundancia. El traductor automático será más eficaz en texto reiterativos, con una sintaxis correcta y sencilla y una baja complejidad terminológica.

Todas estas particularidades serán igual de determinantes para el traductor automático y para las técnicas de postedición que el traductor (profesional o en formación) tendrá que llevar a cabo. Ello influirá en la toma de decisiones del cliente (¿merece la pena contratar a un traductor para este trabajo?) y del traductor para responder a las exigencias del mercado de forma rápida y eficaz.


Utilidad de la traducción automática

La traducción automática se ha revelado útil en determinadas situaciones, especialmente en momentos de urgencia. Un ejemplo es el terremoto que llevó a una multitud de equipos de ayuda extranjeros a un Haití en crisis en el que se habla criollo haitiano.

Además de este tipo de soluciones rápidas y de la economía en la búsqueda de léxico, la traducción automática presenta otras ventajas. Por un lado, permite identificar las grandes dificultades metodológicas del trasvase interlingüístico y de la derivación de unas reglas para el futuro. Por otro, ayuda también a establecer vínculos interdisciplinares con la terminología (como garantía de uniformidad terminológica), la traductología (relacionando las etapas que intervienen en la traducción humana con las de la traducción automática) o la pragmática (y la consideración de aspectos situacionales y socioculturales en el proceso de traducción).

En determinados campos, como la traducción técnica, los programas de traducción automática reducen costes y ahorran tiempo al traductor profesional para conseguir unos resultados aceptables en textos rutinarios y sencillos. También serviría para extraer una idea general de un texto en un borrador tras escanear su contenido. Esta posibilidad convertiría a la traducción automática en una alternativa muy atractiva para investigadores científicos y técnicos, para quienes en muchas ocasiones no se justificaría el esfuerzo de una traducción completa humana de páginas y páginas de texto, a menudo en ámbitos diversos, para localizar las partes que sí merecen una lectura detenida y una comprensión total (Sager, 1988). En estos casos, el avezado lector especializado podría sacar provecho de traducciones menos «refinadas», pero más económicas y rápidas.

En ciertos tipos de traducciones (como la traducción-resumen o la traducción con cambio de destinatario) el sistema automático supondrá una alternativa más pobre que, por ejemplo, para una traducción indicativa.


Propuesta de experiencia

Tras realizar un estudio sobre el conocimiento tecnológico de los alumnos de Traducción (Fernández Pintelos, 2010), quedó patente la escasa relevancia de la traducción automática para estos estudiantes, que sólo la utilizan como diccionario en línea cuando carecen de otros recursos o para traducir en el momento una página web.

Conviene aquí reiterar la necesidad de no apartar a los alumnos de traducción de las herramientas de traducción automática, como respuesta a los clientes cada vez más numerosos que solicitan servicios de postedición de traducciones automáticas y como método para la optimización del aprendizaje del proceso de traducción mediante ejercicios de detección y crítica de errores y aciertos en traducciones automáticas.


Tipos de traducción automática

Según el método de obtención de la información necesaria para realizar la traducción, los sistemas de traducción automática se pueden clasificar en los siguientes grandes grupos.


1. Traducción automática basada en reglas

La traducción automática mediante reglas consiste en analizar el texto (normalmente mediante una representación simbólica interna) e ir reemplazando las palabras del original por su equivalente más apropiado.

Existen diversos grados de abstracción de dicha representación interna: desde los directos (básicamente traducen palabra por palabra), hasta interlingua, con un lenguaje intermedio cuya estructura es independiente de la del original y la del final.

Systran es un sistema de traducción automática basado en reglas que ha alcanzado renombre en las últimas décadas. Dado que se trata de un programa en línea, no permite una preedición del texto original ni otro tipo de interactividad durante el proceso de traducción automática. Solo existe la posibilidad de posteditar el texto traducido una vez terminado el proceso.


2. Traducción automática basada en corpora

La traducción automática a partir de un corpus lingüístico se basa en el análisis de muestras reales con sus respectivas traducciones. Entre los mecanismos que utilizan corpora se incluyen los métodos estadísticos y los basados en ejemplos que realiza la traducción por analogía con problemas similares.

Mediante estos corpora se establece la probabilidad con la que ciertas palabras pueden traducirse Sin embargo, los resultados siguen sin ser satisfactorios a la hora de traducir lengua familiar o coloquial.

En este tipo de sistemas se han hecho grandes progresos en los últimos años y ha nacido un nuevo animal traductor: Google Translate. Este nuevo sistema de traducción automática de 52 idiomas emplea un dispositivo de reconocimiento muy rápido para localizar en la ingente cantidad de textos ya traducidos disponibles en Internet la combinación existente que con más probabilidad encaje. No pretende desmontar y recomponer la frase para desentrañar su significado, sino que rescata lo que se ha dicho una y otra vez en esa lengua y lo escupe crudo o con una elaboración mínima. Como sistema estadístico que es, Google Translate sólo ofrece una versión extraída de su análisis de equivalentes más probables de las frases emparejadas que encuentra en la Red.

Los datos se seleccionan en gran parte a partir de traducciones humanas que pueden llegar a ser muy diversas, desde clásicos literarios (a los que el traductor automático accede a través de la biblioteca mundial de Google Books) hasta obras modernas originales. En el primer caso los resultados son muy interesantes, pero cuando se enfrenta a nuevas obras no rutinarias, Google Translate se pierde en la intención, el contexto real y el estilo.

La diferencia entre los sistemas basados en reglas y los basados en corpora estriba en que en los primeros se sustituyen las palabras del texto original por aquellos equivalentes que el sistema juzga más «ajustados», mientras que en el segundo caso la traducción se fundamenta en el análisis de muestras de traducciones, generalmente realizadas por traductores humanos.


3. Traducción automática basada en el contexto

La traducción automática basada en el contexto utiliza técnicas basadas en hallar la mejor traducción para una palabra fijándose en el resto de palabras que la rodean y eliminando los segmentos que han quedado sin sentido, avanzando, retraduciendo. Filtrando y encadenando los segmentos traducidos. Con un buen diccionario, las reglas gramaticales y un corpus en la lengua destino no es necesario pretraducir ninguna parte, como en los métodos estadísticos.


Traductores automáticos

Para elaborar una relación pertinente de traductores automáticos he partido de las siguientes premisas (Fernández Pintelos, 2010):

  • los estudiantes instruidos en el uso de diferentes herramientas tecnológicas serán después capaces de valorar cada uno de estos recursos y adaptarlos a su realidad laboral de una forma más versátil y eficaz
  • los traductores en general y los traductores en formación en particular poseen un conocimiento limitado de las herramientas de software libre que están a su disposición -entiéndase aquí «software libre» como aquel ajeno a condiciones privativas, en el cual el código fuente es accesible y puede copiarse, modificarse, utilizarse y distribuirse libremente (Free Software Foundation, 2009).
  • el software libre se va perfilando como alternativa sólida y funcional para los nuevos profesionales (incluidos aquellos ajenos a los campos de la Informática y la Telecomunicación) y por tanto digna de ser considerada en las aulas universitarias
  • además, la propia naturaleza del software libre, que puede ser compartido sin restricciones, permite al usuario gozar de una codificación estándar de los datos lingüísticos en los traductores automáticos. El formato básico, el XML, tiene la ventaja añadida de ser muy fácil de procesar.

Por estas razones presento ejemplos de traductores automáticos libres que pueden ser de interés en la formación de mediadores lingüísticos.

  • Apertium: plataforma de traducción automática de código abierto basado en reglas que proporciona datos lingüísticos de un número cada vez mayor de pares de lenguas. Ofrece, además, herramientas para gestionar los datos lingüísticos necesarios para construir un sistema de traducción automática para un nuevo par de lenguas o bien un motor mejorado para un par de lenguas que ya esté funcionando. Esos datos lingüísticos se pueden utilizar para otros fines, como un corrector ortográfico. Es un claro ejemplo de la flexibilidad del software libre.
  • OpenLogos: también basado en reglas, es la versión en abierto del sistema de traducción automática Logos en la que la traducción automática puede ser posteditada por un traductor humano y mantiene el formato del documento original sin grandes variaciones. Ofrece al usuario la posibilidad de crear su propio diccionario personalizado.
  • Traduki: software de traducción automática que pretende incluir lenguas de uso minoritario discriminadas en otros proyectos por motivos económicos. El proyecto, todavía en su inicio, abre las puertas a la creación de nuevas herramientas lingüísticas.
  • Linguaphile: otra buena intención hecha traductor automático, en este caso de ficheros en hasta 56 lenguas.
  • FreeLing: paquete de procesamiento del lenguaje natural desarrollado por la Universidad Politécnica de Cataluña cuyo etiquetador sintáctico y morfológico se puede utiliza para la extracción automática de terminología.
  • SALT: un traductor automático valenciano-castellano y castellano-valenciano financiado por una institución pública (la Consejería de Cultura de la Generalitat Valenciana).
  • Giza++: es un programa de entrenamiento para modelos de traducción automática estadística. Bajo licencia GPL, la traducción se basa en la palabra, no en la frase (como hacen los sistemas más populares en la actualidad). Sin embargo, la mayor parte de sistemas basados en la frase siguen utilizando GIZA + + para alinear el corpus. Hoy existen varias implementaciones de distribución en línea.
  • Cunei: es un sistema de traducción automática híbrido entre los basados en ejemplos y los estadísticos
  • Marclator: traducción automática basada en ejemplos
  • Moses: es un sistema estadístico de traducción automática.
  • Tradubi: aplicación para traducción social construida sobre Apertium que se puede probar en línea. Permite crear y compartir diccionarios y posteditar y almacenar las traducciones creadas por el motor.


Conclusiones y propuesta

En el nivel básico de la traducción automática, en el que la traducción se considera una ecuación en la que se busca el equivalente en la otra lengua como la incógnita x, la traducción por ordenador se reduce a una mera sustitución de palabras de una lengua por las de otra.

Se ha hecho un gran esfuerzo en la creación de mejores herramientas automáticas en los últimos años. Por eso existen distintas arquitecturas para sistemas de traducción automática, como las basadas en reglas o en corpora. En la actualidad la dirección predominante en la evolución del software para traducción automática es la de herramientas que mejoren la productividad del traductor, en particular con textos técnicos muy repetitivos.

En el caso de las técnicas estadísticas de traducción, la retroalimentación entre el ordenador y el traductor humano ofrece versiones aceptables de ciertos tipos de textos. Gracias a los corpora paralelos se pueden emprender traducciones más complejas, incluso de expresiones idiomáticas, y aislar anomalías. Estos sistemas de traducción automática necesitan de una escasa intervención del traductor humano, aunque este puede mejorar la calidad del texto de salida estableciendo parámetros fijos previos.

Hoy en día se obtienen altos niveles de calidad en la traducción automática entre lenguas romances. Por regla general la calidad es inversamente proporcional a la distancia entre los idiomas. Los resultados son mejores cuando los sistemas se especializan en un determinado tipo de texto y un determinado vocabulario.

En la actualidad la tendencia es integrar todo tipo de metodologías: lingüísticas, estadísticas, u otras, a la base de datos de un corpus.

Conviene destacar que hoy en día la traducción automática no se reduce a sistemas automáticos de traducción, ya que abarca desde programas de búsqueda en diccionarios, hasta sistemas muy sofisticados o traducciones rápidas en Internet.

Dado que este tipo de traducción funciona fundamentalmente alineando palabras, el estilo y los matices de la traducción literaria pueden superar las posibilidades de la traducción automática, pero con manuales técnicos o ciertos tipos de páginas web pueden producir traducciones aceptables siempre que el texto original esté correctamente escrito (European Association for Machine Translation).

Es necesario equilibrar la interactividad entre el traductor humano y la máquina. El grado óptimo de colaboración se logrará cuando la máquina ayude al traductor con todos los instrumentos disponibles y al tiempo consulte con él todos los casos que supongan una dificultad para la máquina, como el estilo o las ambigüedades, permitiéndole integrar los procesos de redacción y de traducción.

La traducción automática y la traducción asistida por ordenador pueden ser herramientas didácticas complementarias muy útiles en la enseñanza-aprendizaje de la traducción (Diéguez, 2001). En el aula, el trabajo con sistemas de traducción automática servirá, no solo para formar traductores capaces de llevar a cabo esa estrecha colaboración con la máquina, sino que también ayudará a identificar errores y técnicas acertadas que se pueden aplicar al proceso de traducción humana.


Bibliografía

Bühler, A. et al. (1965) Sprachtheorie. Die Darstellungsfunktion der Sprache, Stuttgart: Gustav Fischer

Diéguez M., María Isabel (2001) «Aciertos y errores en la traducción automática: metodología de la enseñanza-aprendizaje de la traducción humana», en Onomázein, nº6, pp. 203-221

European Association for Machine Translation (2008) <http://www.eamt.org/mt.php>

Fernández Pintelos, María José (2010) «Software libre na universidade: o caso da Licenciatura de Tradución e Interpretación», en Viceversa. Revista galega de tradución, nº 16 (en preparación)

Free Software Foundation (2009) "The Free Software Definition" [en línea]. Disponible en Web: <http://www.gnu.org/philosophy/free-sw.html> 2009

Maia, Belinda (2008) «CORPÓGRFO V.4. Tools for educating translators», en Yuste Rodrigo, Elia Topics in language resources for translation and localisation, John Benjamins Publishing Company, pp. 57-71

Nord, Ch. (1988) Textanalyse und Übersetzen, Heidelberg: Julius Groos Verlag

Oliver, Antoni & Joaquim Moré (2008) Traducción y tecnologías. Technology and Translation, Editorial UOC

Reiss, K. (1983) Texttyp und Übersetzungsmethode. Der operative Text, Heidelberg: Julius Groos Verlag

Sager, J.C. (1988) «La traducción automática y una tipología de textos», en Actas V Congreso nacional de lingüística aplicada. U.N. Tucumán, pp. 35-49