Herramientas informáticas de soporte a la traducción: tendencias actuales y campos futuros de desarrollo En este artículo intentaré exponer brevemente el estado actual de aplicación de las tecnologías informáticas en el ámbito profesional de la traducción. Repasaré brevemente los principales programas del mercado, la forma como interactúan, y finalmente propondré algunas posibles tendencias de actuación futura en este campo.

1. Las tecnologías actuales

En la actualidad, podemos afirmar que las tecnologías relacionadas con las memorias de traducción y la gestión de terminología tienen un grado de aplicación elevado en el sector profesional de la traducción.

Con respecto a las memorias de traducción, las empresas, los profesionales independientes y los organismos públicos o privados con departamentos internos de traducción y documentación tienen a su alcance diferentes programas existentes en el mercado (algunos de los más extendidos en casa nuestra serian TRADOS Translator's Workbench, Star Transit, Atril Déjà Vu). En algunos casos utilizan sus propias herramientas internas, como en el caso del programa IBM TranslationManager/2, que de ser pionero en el campo de los programas gestores de memorias de traducción ha pasado a quedar casi exclusivamente restringido a un uso interno por parte de los diferentes centros de traducción de IBM repartidos por el mundo, o incluso el caso de Microsoft, que progresivamente está incorporando los programas de TRADOS (empresa de la cual posee un porcentaje importante de las acciones) como herramientas estándar de trabajo. Nos encontramos también con el caso de grandes proveedores de servicios de traducción, a nivel internacional, que han optado por desarrollar sus propias soluciones de memorias de traducción: SDL, con su programa SDLX, Alpnet, con su programa WinJoust, de poca difusión externa, o Lionbridge, con el ForeignDesk.

Todos estos programas incorporan herramientas que permiten reaprovechar traducciones antiguas realizadas sin memoria de traducción, siempre y cuando se conserve en soporte informático la versión original y la traducida. Son lo que llamamos programas de alineación, que aparejan cada segmento del documento original con su traducción correspondiente, y almacenan los pares en una base de datos, que directamente o posteriormente se convertirá en memoria de traducción.

TRADOS, con su programa Translator's Workbench, implantó su hegemonía en el mercado a partir de mediados de los años 90, y todavía la mantiene; los principales competidores, Star Transit y Atril Déjà Vu, a pesar de ser productos de una calidad perfectamente comparable, no han alcanzado la cuota de mercado de TRADOS a nivel mundial, aunque parece que progresivamente ganan adeptos.

Los programas de gestión de terminología han sido muy relacionados tradicionalmente con el desarrollo de las memorias de traducción. De hecho, podemos decir que los principales programas de gestión de memorias de traducción tienen su correspondiente programa gestor de terminología, para trabajar de forma interactiva. Así podríamos hablar de TRADOS MultiTerm, Transido TermStar y también del gestor de terminología incorporado en el programa Atril Déjà Vu. Parece que en estos últimos años estas soluciones han perdido un poco de protagonismo ante la progresiva implantación del gestores de memorias de traducción. Así, TRADOS ha estado retrasando durante bastantes años la revisión de su versión de MultiTerm, favoreciendo el desarrollo de Translator's Workbench, y podemos decir que en la actualidad la elección de los gestores de terminología en el ámbito profesional generalmente se subordina a la elección del programa de gestión de memorias de traducción.

Finalmente, simplemente comentar que cualquiera de las tecnologías, y más específicamente los programas mencionados anteriormente, soportan sin ningún tipo de problema el trabajo en catalán.

2. Las tecnologías emergentes

La implementación de estas dos tecnologías (memorias de traducción y gestión de terminología), se ve complementada por otros tipos de aplicaciones, que las diferentes corporaciones implicadas en el sector de la traducción tienen también a su alcance. Mencionaremos rápidamente la existencia progresiva de programas destinados a facilitar o mejorar la gestión de los proyectos, específicos para el sector de la traducción, como el programa LTC Organiser, de Language Technology Centre, o el nuevo módulo de gestión de proyectos incorporado en la última versión de TRADOS Translator's Workbench, nombrado WorkSpace.

Con respecto a la traducción automática, bajo esta denominación reunimos todas las tecnologías en las cuales a partir de un texto original y con la intervención exclusiva de sistemas informáticos obtenemos un texto traducido. Con unas bases teóricas y prácticas muy anteriores a las de las memorias de traducción, las diferentes iniciativas de investigación en el campo de la traducción automática han pasado por diversas etapas de desarrollo a lo largo de los años. Inicialmente, la traducción automática se percibió como una posible amenaza para los traductores, pero en la actualidad se ha consolidado como un posible complemento en su trabajo. Podemos afirmar que las memorias de traducción han cogido el protagonismo que originariamente se suponía que asumiría la traducción automática. A nivel internacional, y entre los productores multilingües, hay que destacar las empresas Sail-Labs, empresa alemana con un centro de desarrollo de pares de lenguas en Barcelona, Systran, empresa francoamericana pionera en las tecnologías de traducción automática, con más de 30 años de actividad, Softissimo, propietario de la tecnología y el grupo de productos Reverso, y IBM, que continúa desarrollando iniciativas en este campo, a través de su empresa Alphaworks y su centro de desarrollo e investigación en Nueva York, y que recientemente ha incorporado su tecnología en el conjunto de programas WebSphere. Hay que mencionar por la especial calidad de su producto, dentro del ámbito europeo, la empresa alemana Linguatec, heredera de la tecnología de IBM y propietaria del software Personal Translator, reconocido sobradamente como el mejor paquete de software de traducción automática, con la limitación de contar con dos únicas combinaciones de lenguas (alemán-inglés y alemán-francés).
En el área lingüística de habla catalana nos encontramos con cuatro modelos diferentes dirigidos a elaborar soluciones informáticas de traducción automática bidireccional catalán-castellano. Se trata de las soluciones de Sail-Labs, que funciona en una plataforma Sun, la iniciativa Internostrum de la Universidad de Alicante, accesible mediante un servidor de Internet, el programa Salt de la Generalitat Valenciana (con su programa correspondiente adaptado al dialecto oriental, Autotrad Ahora), en plataforma Windows, y la tecnología utilizada por el diario El Periódico, vinculada comercialmente con la empresa AutomaticTrans. Las pruebas realizadas con algunos de estos sistemas demuestran que el nivel de calidad final de la traducción es mucho correcta en todos ellos, facilitada enormemente por la proximidad estructural de ambas lenguas. De cara a usuarios profesionales, podríamos aproximar un grado de error (frases traducidas no utilizables) del 15%, cuando en la mayoría de combinaciones de lenguas europeas nos movemos en unos grados de error aceptables próximos al 25-30%.

3. Relación entre traducción automática y memorias de traducción

Con respecto a la relación entre las memorias de traducción y la traducción automática, buena parte de los programas gestores de memorias de traducción incorporan la posibilidad de interactuar de alguna manera con la traducción automática. Algunos de los programas de traducción automática permiten también que el usuario almacene el producto de una traducción hecha por la máquina en memorias de traducción (Sail-Labs, Linguatec).

Hay que destacar también que los grandes grupos internacionales de servicios relacionados con la traducción han empezado a interesarse activamente por el campo de la traducción automática. Así, SDL ha adquirido recientemente la empresa americana TransparentLanguages para incorporar la tecnología Transcend en su programa de gestión de memorias de traducción SDLX, con lo cual puede ofrecer a grandes clientes un conjunto de soluciones integradas que incluye traducción automática, memorias de traducción y servicios de postedición, sin la intervención de otras empresas en el proceso. Berlitz colabora activamente con Systran y Lionbridge ha firmado recientemente un extenso acuerdo de colaboración con Sail-Labs.

4. Cuestiones pendientes y futuras tendencias

Como he comentado anteriormente, la utilización de las memorias de traducción en el sector profesional está bien asentada, y en este sentido la principal incógnita de cara al futuro se centra en los posibles programas y estándares que dominarán el mercado. Con respecto a los estándares, parece que el TMX, reconocido como estándar de intercambio de memorias de traducción, se acabará imponiendo, todo y que su implantación, hoy por hoy, todavía no está generalizada. Con respecto a los programas, parece difícil de que TRADOS pierda fácilmente su hegemonía, aunque parece que Star y Atril recortarán progresivamente su cuota de mercado.

La situación del uso de la traducción automática es bien diferente, y ofrece una serie de incógnitas que al mismo tiempo se convierten en posibles campos de desarrollo.
Los grandes problemas que los usuarios profesionales han encontrado en la traducción automática han sido, habitualmente, los siguientes:

a) Calidad

Las expectativas elevadas de calidad de los potenciales usuarios hacen que tradicionalmente se considere que la calidad general de las traducciones generadas por los programas de traducción automática es muy baja. Un estudio más profundizado de esta cuestión demuestra que mucha parte de los problemas que se atribuyen a la calidad de la traducción automática tienen una relación directa con la baja calidad de los documentos originales que se traducen, y también que el elevado grado de expectativas de calidad de los usuarios a menudo es fruto de una falta de conocimiento sobre las posibilidades y los usos idóneos del software de traducción automática.

b) Terminología

Otra queja tradicional de los usuarios de la traducción automática ha sido la poca adecuación terminológica o de registro de la traducción automática. La incorporación de léxicos específicos o la ayuda de las herramientas de extracción de terminología a menudo no se traduce en una mejora de la calidad de traducción, y tampoco se ha acabado de encontrar un buen modelo para tratar el tema de la traducción no deseada de los nombres propios, percibido muy negativamente por parte de los usuarios finales.

5. Futuros retos para el catalán

a) La visión global en el área de lengua catalana, en definitiva, es la siguiente: tenemos perfectamente a nuestro alcance un amplio abanico de programas que nos permiten trabajar con memorias de traducción. Tenemos también a nuestra disposición cuatro diferentes tecnologías de traducción automática para elegir, con un grado de calidad de traducción suficiente. El primer reto, pues, es hacer que éstas las memorias de traducción y la traducción automática se combinen efectivamente y permitan una mejora de la producción y de la calidad final de las traducciones. Tarde o temprano, las empresas y organismos públicos del área lingüística catalana responsables de tecnología relacionada con la traducción automática tendrán que adaptar sus programas por tal que incorporen memorias de traducción o para aportar a los posibles clientes soluciones de interacción entre la traducción automática y la traducción asistida.

b) Paralelamente, hace falta un mayor desarrollo de herramientas informáticas que permitan ayudar a controlar la calidad de los documentos originales, como paso previo al proceso de traducción. Los correctores ortográficos y gramaticales tradicionales (corrector del MS Word, WordCorrect, etc.) se han mostrado insuficientes en este sentido. Calan herramientas de análisis similares a lo que en el caso del inglés se está haciendo desde hace bastante de tiempo con el lenguaje controlado, y que en el caso de otras lenguas como el catalán está en un estadio muy incipiente.

c) Finalmente, hay que dar un empuje a la utilización de las herramientas de análisis y extracción terminológica, y hay que hacer que los programas existentes de traducción automática incorporen plenamente la posibilidad de incorporar bases de datos terminológicas de programas externos.

En definitiva, lo que se plantea es una mayor necesidad de investigar en campos nuevos, de cara a mejorar la calidad final de las traducciones, tanto si se hacen exclusivamente utilizando memorias de traducción como si se utiliza el soporte de la traducción automática. Más que insistir en el desarrollo de más iniciativas relacionadas con la traducción automática entre catalán y castellano, o en la mejora de la calidad de traducción proporcionada para los programas existentes, parece que el campo de investigación que queda más descubierto, hoy en día, es el de la mejora del proceso previo a la traducción, como clave para mejorar de forma ostensible el resultado final, es decir, los textos traducidos.

© Copyright Xavier Arderiu Monnà, 2001 - se prohíbe la reproducción total o parcial de este artículo sin autorización expresa del autor