«

»

Mar 11

Imprimir esta Entrada

Traducción: Apaga y vámonos.

A nadie le vamos a descubrir nada nuevo si afirmamos que la traducción asistida ha supuesto el mayor trasiego ocurrido en el mercado de la traducción.

Y tampoco que la memorias de traducción son la base de ese sistema.

Sin embargo la traducción asistida no es más que un paso molesto en el horizonte de las grandes industrias de la lengua. La traducción automática y la edición controlada son los dos verdaderos objetivos.

De ahí que no fue nada extraño que el producto estrella del sistema, las memorias de traducción, se acogieran a un formato estandarizado en poco menos de una año (la primera versión publicada, la 1.1, apareció en 1997). Y enfatizo lo de extraño: ¿Cuándo, en la historia de las relaciones comerciales, los más acérrimos competidores han acordado compartir sus más preciados valores sin que nadie se lo exigiera?

La razón nos parece, ahora, más que obvia. Las memorias de traducción no fueron creadas para facilitar la vida a los traductores sino para plasmar en un formato tangible el conocimiento acumulado por ellos. El punto de mira: la traducción automática basada en referencias y los sistemas de edición controlada.

De todas formas, no es esta la línea que quiero enfatizar. Doy por hecho que las memorias de traducción son algo irreversible y que nada podrá ya con ellas. Mi objetivo son los dos nuevos estándares que las complementan: SRX y GMX.

Las memorias de traducción pueden ser compatibles. Sin embargo no son totalmente intercambiables. Una memoria de traducción es una colección de pares de segmentos original-traducción generados durante un proceso de alineación o de traducción asistida. En esa definición se esconde su propio pecado. Los segmentos se establecen según una serie de reglas prefijadas propias de cada herramienta. Así, pues, la segmentación de Trados no coincide exactamente con la de SDL Trados, ni ésta con la de MemoQ, ni ésta con la de Wordfast… En resumen: por mucho que pasemos memorias de un programa a otro, los resultados que obtendremos de su utilización no serán los mismos. Por lo tanto, el mito de que un traductor puede trabajar en cualquier programa y luego intercambiar la memoria con su agencia o con el cliente en formato TMX es, simplemente, falso.

El otro problema, la forma en cómo archivaban las informaciones secundarias (formatos, etiquetas…) lo resolvieron convenientemente en las diferentes actualizaciones del estándar.

Pues bien, en 2004 se publicó un nuevo estándar que están aplicando, más o menos encubiertamente, los fabricantes de herramientas de traducción asistida: el SRX.

El SRX es, según su propia definición: …The vendor-neutral standard for describing how translation and other language-processing tools segment text for processing.

El estándar SRX consiste en un lenguaje que esquematiza las reglas de segmentación de forma tal que pueden importarse y exportarse hacia y desde la propia aplicación. Eso significa que si yo dispongo de la definición SRX que se ha utilizado en un determinado proyecto y la exporto junto con la memoria, otro programa que pueda incorporar esa definición de segmentación utilizará la memoria en cuestión CON LOS MISMOS RESULTADOS (o casi) que el programa original.

La especificación 2.0 de SRX apareció en abril de 2008, y pocos son los programas que la han adoptado oficialmente (OmegaT, por ejemplo). Sin embargo, una visita a la segmentación de SDL Trados (en Reglas de segmentación, Recursos de idioma, Ajustes de la memoria de traducción) nos mostrará un lenguaje totalmente similar al utilizado por SRX.

captura SDL

captura SDL

En pocos meses, pues, la cuestión cuál es la herramienta de traducción asistida utilizada dejará de tener importancia, y la obtención y acumulación de memorias avanzará otro paso.

No obstante, esto era algo ya conocido. Vamos ante la última vuelta de tuerca del sector. Si la herramienta es indiferente ante el resultado final (en lo que a productos se refiere, no a calidad de la traducción), ¿qué elemento falta por controlar en los procesos de traducción asistida?

La respuesta es el precio. Ante cualquier proyecto de traducción las diferencias de conteo de palabras de los diferentes programas de traducción asistida podían ser verdaderamente escalofriantes (nosotros mismos habíamos constatado diferencias de 25.000 palabras en proyectos de 250.000 y LISA habla de un 30% de diferencia).

¿Cuál es la respuesta de LISA a este tema? GMX

Recordemos que LISA no la forman sólo empresas del perfil de SDL, sino que en ella participan empresas clientes de traducción, agencias y otros muchos actores… como asociaciones de traductores (consultar listado de miembros de LISA: http://www.lisa.org/LISA-Members.74.0.html).

¿Y qué es GMX? Acrónimo de Global information management Metrics eXchange, el GMX se perfila en tres grandes ramas: Volumen, Calidad y Complejidad. Dejando los dos últimos que todavía están por definir, volvamos a citar sus propias palabras: GMX-V provides a standard and more precise definition of the statistics necessary for to assess the quantity of text (and costs) associated with language-related globalization tasks.

Por lo menos nadie se esconde: Aluden directamente a los costes.

Por lo tanto, si las memorias de traducción son totalmente equivalentes, si los segmentos se construyen siguiendo las mismas reglas y si el conteo de palabras da un resultado igual en todas las herramientas… ¿A qué conclusión, fatídicamente, podemos llegar?

A la imposición de tarifas.

Pues, evidentemente a ellos tampoco se les escapa: Such differences make it difficult for content creators to know the cost of translation in advance and make direct comparison of prices difficult since the basis for prices is not transparent.

Analicemos la situación desapasionadamente. Las herramientas no desaparecerán y el objetivo inicial de la traducción automática parece tener ciertos límites (Google parece ser que ha filtrado que deja de invertir en la mejora de determinados pares de lenguas ya que para conseguir incrementos de calidad ínfimos se necesitan cada vez inversiones más astronómicas). Por lo tanto la convivencia de traductor + traducción asistida + traducción automática es una ecuación con tendencia a una constante universal. Debemos pues adoptar una decisión que pasa por ser expertos en tecnologías y mejores que los demás en algo.

Algunos traductores de referencia que ya han alcanzado esos niveles no tienen reparos en rasgarse las vestiduras ante las imposiciones de Microsoft, de SDL, de las agencias de traducción… es fácil cuando puedes cobrar 20 ó 25 céntimos de euro por palabra (traducciones del inglés al español y a través de agencia) o cuando tu hipoteca no depende de lo que ganas traduciendo. En cambio los traductores que empiezan o los que de una manera más o menos inocente han caído en la trampa de la uniformidad pueden empezar a temblar. O cambian de profesión o empiezan a ponerse las pilas.

Si queréis más información sobre estos temas:

Salvador Aparicio

9 comentarios

Ir al formulario de comentarios

  1. Mercedes

    Hola, soy una estudiante de traducción y tenemos un trabajo en el que tenemos que realizar presupuestos de traducciones, me gustaría saber como se cobra una memoria de traducción que tengas que realizar tu, me han pedido Omega T.
    Gracias.

    1. Salvador

      Hola Mercedes,

      Un presupuesto es algo más que la aplicación del contador de palabras de Word. De hecho la ahora extinta asociación LISA estaba trabajando en un estándar para uniformizar los sistemas de conteo de palabras en los proyectos de traducción. En un estudio preliminar que se realizó los resultados diferían, para un mismo proyecto, en un 40% en función de la herramienta que se utilizara. Y contar las palabras es solo el primer paso, ya que la utilización de programas de traducción asistida supone la necesidad de aplicar tarificaciones específicas según el grado de reutilización de una memoria de traducción. Y esas tarificaciones están directamente relacionadas con la calidad de la memoria…

      Con OmegaT dispones de una utilidad llamada estadísticas que te proporcionará un conteo de las palabras y segmentos y otra llamada estadísticas de coincidencias que te proporcionará pistas sobre la reutilización de la memoria.

      De todas formas, por tu pregunta no acabo de saber si lo que me preguntas es por el precio de la propia memoria de traducción. Si estamos hablando de construir memorias de traducción a partir de materiales ya traducidos (lo que se conoce como alinear documentos), entonces el trabajo debería facturarse por horas, ya que no es lo mismo alinear, por ejemplo, frases en español y portugués que en el par inglés francés. Cuanto mayor sea la distancia sintáctica entre las lenguas, más lenta es la alineación.

      Y si a lo que haces referencia es a la valoración de tu memoria de traducción, la que generas al traducir, hay que tener en cuenta algo vital: la memoria de traducción de un traductor que no sea específica para un proyecto o para un cliente (por lo tanto la memoria general que utiliza un traductor y que en consecuencia reúne segmentos de varios proyectos y clientes) está sujeta a las leyes que protegen la confidencialidad y, en consecuencia, proporcionársela a terceros es, simplemente, un hecho delictivo.

      En AulaSiC, tenemos un curso específico para aprender a hacer presupuestos, por lo que puedes imaginarte si el tema da para variaciones.

      Un abrazo.

  2. Gina Hardinge

    Oí que LISA había entrado en suspensión de pagos o incluso en concurso de acreedores. ¿Es cierto? En cuyo caso, ¿qué pasará con todos estos intentos de normalización?

    1. Salvador

      Hola Gina,

      Hace unos días que lo anunciaba en su página web, hoy la página está muerta, simplemente aparece el anuncio del desastre.

      El tema tiene más miga de lo que parece. TMX no desaparecerá… existen demasiados intereses para que ello ocurra. SRX… pues lo mismo. En los que no tengo nada claro qué futuro les espera son los estándares relacionados con la terminología (TBX y relacionados) ya que son estándares muy necesarios pero muy complicados y, en consecuencia, caros. El otro que quedaba en cartera era GMX, éste estaba muy verde, por lo que, probablemente, se abandonará.

      De todas formas, la cuestión es el porqué de esa desaparición… O ha pasado algo en la administración y dirección de LISA o, y eso sería lo más preocupante, las principales compañías del sector han decidido dejarla caer… en este caso: ¿cuál podría ser la razón?

      Será cuestión de estar atentos al tema y ver por donde estalla lo que se esté cociendo.

  3. Oscar Calvo

    Buen artículo Salvador.

    Me interesa eso que comentas de que «Google parece ser que ha filtrado que deja de invertir en la mejora de determinados pares de lenguas ya que para conseguir incrementos de calidad ínfimos se necesitan cada vez inversiones más astronómicas».

    Donde lo has visto?

    1. Salvador

      No lo he visto,

      Me lo contaron en una conversación que tuve con especialistas en tecnologías de la traducción. Por eso lo del ‘parece ser’, ya que no es información directa. Sin embargo las fuentes eran lo suficientemente serias como para darles un cierto grado de credibilidad. De hecho, si alguien tuviera acceso a una información ‘oficial’ soy el primer interesado en poder contrastar la noticia, ya que hace tiempo mantenemos en SIC una discusión sobre si el siguiente paso es mejorar la traducción automática estadística con la inclusión de reglas o mejorar la traducción automática por reglas con traducción estadística.

      1. Luis Villarejo

        Hola,

        yo leí una notícia al respecto en:

        http://www.1-800-translate.com/TranslationBlog/index.php/2010/12/24/google-translate-is-finished/

        A partir de ahí se puede seguir el hilo de las declaraciones de la gente de Google al respecto.

        Luis

  4. Albert

    No veo motivo de alarma. Las tarifas ya las imponen, se utilice el programa o el método de recuento que se utilice, y aceptarlas es como las lentejas: o las tomas o las dejas.

Los comentarios han sido desactivados.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies