miércoles, 28 de marzo de 2012

Alineación de textos paralelos

¿Qué es la alineación? Se trata de un término relacionado con las memorias de traducción que, como ya sabemos, cuanta más información tengan almacenada, más útiles serán. Tenemos dos opciones para alimentarlas: una es ir llenándolas de textos a medida que vamos trabajando y otra es a partir de traducciones ya hechas que alinearemos.
Vale, pero seguimos sin saber en qué consiste alinear. Paciencia, ya lo explico. Alinear es crear un texto bilingüe (también llamado bitexto) en el que se relacionan el texto original y su traducción. Estos textos se almacenan en la memoria de traducción segmento por segmento. Las herramientas que realizan esta tarea, llevan a cabo una lectura paralela, es decir, leen el texto de forma secuencial haciendo coincidir el original y la traducción, de manera que generan un nuevo texto en el que quedan enlazados el primer segmento del original con el primero de su traducción. Esto se conoce como corpus textual y es la base de la memoria de traducción. Pero, cuidado, porque estas herramientas no alinean de forma textual, lo que significa que si digo que un texto es una traducción de otro, aunque no tengan nada que ver, la herramienta los va a alinear. Por lo tanto, para evitar este problema, hay que llevar a cabo un proceso de selección de textos y otro de revisión de resultados.
Muchas memorias de traducción, como Trados o Déjà Vu, cuentan con su propio paquete de alineación, pero también podemos encontrar sistemas de código abierto que no están asociados a ninguna plataforma, como Bitext2tmx y LF Aligner. El proceso de alineación es semiautomático y, como ocurre con los programas de traducción automática, obtendremos un mejor resultado si aplicamos unas normas de pre-traducción al texto que queremos alinear.
Tras entender la teoría, estuvimos alineando en clase con Déjà Vu y Bitext. 
Déjà Vu trabaja con más de un archivo a los que nos referimos como proyectos, que estarán en entornos (en un entorno hay varios proyectos). Cuando creamos un nuevo proyecto de alineación, tenemos que elegir las dos lenguas con las que trabajaremos; después, seleccionaremos el texto que queremos alinear y se cargará por segmentos. Nosotros tendremos que decidir en cada par de segmentos (el del español y la otra lengua con la que trabajemos) si están bien o si tenemos que modificar algo. A continuación, se puede ver una captura de pantalla en la que se ven algunos puntos que más tarde eliminé porque no se traducen.

Déjà Vu
 Cuando hemos acabado de alinear, exportamos el contenido a una memoria. Así, poco a poco y a base de exportar textos, iremos alimentando nuestra memoria para luego poder utilizarla.
Por otro lado, Bitext es un alineador de código abierto cuya configuración se parece mucho a la de Déjà Vu, aunque éste último es más preciso. Se trata de un programa que sirve únicamente para alinear y su procedimiento es muy sencillo. El objetivo es mandar los textos alineados a memorias de traducción.
Este es el aspecto de Bitext:

Bitext
 
Es importante saber que el formato con el que suelen trabajar todas las memorias de traducción es .tmx, por lo tanto, si tenemos textos en pdf o Word, debemos cambiarlos a tmx, que es un formato de texto plano con lenguaje de etiquetado en el que podemos distinguir dos partes: las etiquetas header, con información de control que sirve al programa que recibe el contenido para interpretar los datos, y las etiquetas body, que contienen todos los segmentos alineados.
Esto es todo por hoy, en las próximas clases seguiremos indagando en el misterioso mundo de las memorias de traducción así que es probable que vuelva a escribir sobre el tema. Personalmente, me costó un poco entender cómo alinear, pero una vez cogí el tranquillo, vi que no es muy complicado. Al trabajar con varios programas, me he dado cuenta de que no hay mucha diferencia entre ellos porque todos funcionan de un modo similar. De momento, no me veo traduciendo un encargo con la ayuda de una memoria de traducción, quizá es porque me interesa más la traducción literaria que la traducción técnica y, por eso, no le encuentro mucha utilidad. No obstante, con los ejercicios realizados en clase, he comprobado que los resultados son muy buenos comparados con los de un traductor automático, puesto que las memorias de traducción son un complemento para el traductor que le ayudan a realizar su trabajo de forma más rápida y eficaz, lo que quiere decir que nunca se usará su propuesta de traducción de forma definitiva.

0 comentarios:

Publicar un comentario