Tuesday 29 May 2012

Nueva Versión GUI de LF Aligner

Como ya comentamos en la anterior entrada del Calco, el creador del extraordinario LF Aligner nos había comentado que estaba a punto de publicar una nueva versión del programa y justo desde hoy se puede descargar gratuitamente en la página web de Sourceforge.

La principal novedad de la versión 3.0 es que se ha agregado una interfaz GUI al programa para que tenga una apariencia más típica de Windows. En realidad, el programa sigue abierto en el estilo MS-DOS que siempre ha tenido pero las preguntas para alinear los documentos se nos hacen desde ventanas de Windows mucho más atractivas, lo que seguro hará que el programa llegue a un mayor número de usuarios.

Al estar actualmente en versión beta, el autor agredece todo tipo de feedback por posibles errores o comentarios sobre mejoras (lfaligner@gmail.com).




Friday 18 May 2012

LF Aligner: el alineador automático de código abierto


Hace ya un tiempo que descubrí en un foro este maravilloso programa que sirve para alinear automáticamente textos traducidos con sus respectivos originales y crear una memoria de traducción en el estándar TMX con los resultados obtenidos. Para los que no sepan en qué contextos les puede venir bien los alineamientos de documentos ya traducidos, os pongo tres ejemplos:

  • Si te acabas de montar en el tren de las memorias de traducción y anteriormente tradujiste documentos a pelo desde Word o similar, alinear tu trabajo te servirá para que esas traducciones se conviertan en referencia dentro de una TM que podrás utilizar con la herramienta de traducción asistida de tu elección.
  • El cliente te acaba de mandar un proyecto con referencia consistente en documentos originales y su traducción.
  • Has conseguido encontrar por Internet un pdf traducido y su respectivo original, los cuales te vienen genial como referencia de la traducción con tanta terminología que tienes entre manos.

Si nos dedicamos a buscar cada término que queremos consultar en el original y, a posteriori, tenemos que localizar la zona del documento traducido en el que aparece su equivalente, ya podemos ir solicitando extensiones en la fecha de entrega porque malgastaríamos un tiempo muy valioso. No obstante, si logramos alinear correctamente esos documentos, se puede crear una memoria bilingüe que importaremos en nuestra CAT favorita (o en el extraordinario ApSIC Xbench) para poder realizar esas búsquedas rápidamente.

No sé si alguna vez habéis utilizado los programas de alineación que vienen incluidos en la mayoría de los programas de traducción asistida del mercado como WinAlign de Trados, Wordfast Aligner, Align en SDLX o MemoQ Aligner: para verificar los datos alineados y lograr unos resultados de calidad razonables, realmente hay que poner mucha concentración y tiempo de tu parte. Cuando trabajaba como traductor en plantilla, a veces tenía que alinear traducciones de este modo y, pasadas varias horas o incluso días, el trabajo se convertía en un suplicio que me hacía reflexionar sobre el valor real de mi trabajo; es decir, me daba la impresión de que no merecía la pena invertir tanto tiempo y energía en una tarea tan tediosa. Pero, gracias a LF Aligner y al algoritmo en el que se basa, todo este tiempo puede verse reducido en gran medida, debido a que automatiza los procesos necesarios consiguiendo prácticamente los mismos resultados.

Antes de adentrarnos en el programa, os voy a contar cómo di con él y así entenderéis mejor lo que os puede ofrecer. Gracias a sitios web como Linguee, que se dedican a buscar la traducción de términos comparando textos online traducidos con los originales de una manera bastante automática, me dio por investigar si ya habría alguna herramienta que permitiera esto mismo con tus propios textos o con la referencia de un proyecto. Al poco tiempo, encontré uno que justamente lo logra con unos resultados francamente buenos: Alignfactory. Lo único es que sus precios no están pensados precisamente para trabajadores independientes (como podéis en el enlace anterior) y solo he podido corroborar sus fantásticas funciones mediante YouAlign, una web desde la que se puede utilizar el potente motor de la herramienta a modo de prueba en un máximo de 100 segmentos.

De ahí, di a parar en el foro que os comentaba, en donde encontré justo lo que buscaba: LF Aligner, la alternativa perfecta de código abierto que consigue alinear documentos de una manera parecida a Alignfactory y que no se basa únicamente en los parámetros y segmentación de los alineadores tradicionales, sino en un maravilloso algoritmo –igualmente de código abierto–, llamado Hunalign, el cual alinea las fuentes de datos multilingües de manera automática. Este algoritmo obtiene tan buenos resultados porque, aparte de la segmentación habitual, también tiene en cuenta la longitud de las frases, un diccionario interno y “magia negra”, en palabras del creador de LF Aligner, un traductor húngaro con notables inquietudes por la programación.

Aunque su interfaz en estos momentos no sea muy user-friendly que digamos (aunque, como me ha comentado su creador, muy pronto va a publicar la primera gran actualización que va a dotar al programa de una interfaz de estilo GUI), su uso es sumamente sencillo: primero, tenemos que situar los dos documentos a alinear en una misma carpeta; abrimos el ejecutable y, tras elegir el formato de los archivos que queremos alinear y seleccionarlos (si se produce algún error, aseguraos de que no haya acentos u otros caracteres especiales en la ruta ni en el nombre del archivo), vamos respondiendo a las preguntas que nos hace el programa. En uno de los pasos, podemos abrir un archivo Excel para revisar los alineamientos antes de crear la memoria en TMX. Este es el único paso en el que vamos a tener que poner algo de nuestra parte y si no necesitamos que esté todo perfecto, podemos ignorarlo.

Además de ser compatible con numerosos formatos, incluso .docx o .pdf (este último es recomendable exportarlo en txt UTF-8 con un programa de edición de pdf como Adobe Acrobat Pro antes de ser procesado por el programa), LF-Aligner cuenta con la posibilidad de descargar automáticamente documentos traducidos de la Comisión Europea, el Parlamento Europeo y la legislación de la Unión Europea. Os recomiendo que os leáis el documento Readme, que viene incluido en la carpeta de instalación, para obtener información más detallada de lo que os puede ofrecer esta herramienta única, así como consejos de uso y soluciones a los errores más habituales que pueden producirse al alinear documentos.

Como comentaba antes, ya os mantendremos informados desde el Calco sobre todas las novedades de la versión que está a punto de publicarse y que supondrá una mayor accesibilidad para esos usuarios que de primeras desconfíen de la interfaz MS-DOS de la vieja escuela con la que en estos momentos cuenta la herramienta.