• Contacto y otras páginas web
  • Política de privacidad
  • Ponencias y entrevistas
  • Proyectos
  • Servicios
  • Sobre la autora

En la luna de Babel

~ Blog sobre lenguas y traducción

En la luna de Babel

Archivos de etiqueta: traducción automática

Traducción automática y TAV: poseditar subtítulos

04 lunes Sep 2017

Posted by enlalunadebabel in Subtitulación, Traducción, Traducción audiovisual

≈ 12 comentarios

Etiquetas

DeepL, Linguee, MT, traducción automática, traducción automática neuronal

Estas semanas ha vuelto a salir el tema en redes de si las máquinas nos van a quitar el trabajo. Es la historia interminable, sí. Al parecer hay dos corrientes de pensamiento entre traductores: los que se niegan en rotundo a pensar que algo así pueda suceder y los que opinan que es una realidad a medio/largo plazo que hay que empezar a asumir. Y por asumir me refiero a que debemos mejorar nuestras habilidades en posedición porque puede que ahí esté parte de nuestro sustento.

Hace unos años, con ese afán juvenil y amor traductoril, me hubiera decantado por la primera, pero ahora me incluyo en el segundo grupo. Avanzo ya que con matices, claro. Se están desarrollando muy buenas herramientas de traducción automática (hay que dejar de pensar únicamente en Google translate y sus meteduras de pata habituales) que pueden ser incluso ventajosas para nosotros, pero no sirven para todo tipo de textos.

La revolución de las redes neuronales artificiales

En twitter hablamos del tema algunos compañeros a raíz de una serie de artículos (me atrevería a decir publicitarios) de DeepL que han aparecido en prensa, como este. Frases como «Los traductores profesionales conservarán sus trabajos durante, al menos, 20 años más» hicieron arquear las cejas a más de uno y no es para menos. Detrás de esta herramienta está la misma empresa que desarrolla Linguee, que supongo que muchos conocéis, con sus luces y sombras.

Estas nuevas herramientas están basadas en redes neuronales, según cuenta Gereon Frahling, director general de DeepL y exempleado de Google: «El servicio, al igual que sucede con otras tecnologías similares, encuentran su motor de crecimiento en el “machine learning” o “aprendizaje automático” basadas en redes neuronales artificiales. Es, pues, una de las revoluciones más recientes y que aplicadas en el campo de la robótica está logrando, junto a los modelos de “deep learning” o “aprendizaje profundo” que la Inteligencia Artificial sea capaz de mejorar rápidamente y “aprender” en función de los supuestos introducidos».

Sin embargo, está por ver que el traductor automático supere la calidad de una traducción humana. Esto dice Frahling: «Esperamos que suceda en unos años, pero no podemos apoyarnos en ninguna base sólida. A veces, ni siquiera el contexto basta: los traductores profesionales traducen según el cliente, el público al que va destinada la traducción, el ámbito de especialidad, el objetivo de la traducción o un producto, el registro deseado, la edad del destinatario, etc. Todos estos son datos que una red neuronal no tiene».

Algunos compañeros que lo han probado en textos periodísticos y generalistas, como Jota o Jordi Balcells, se muestran sorprendidos con la calidad de la traducción, que, en efecto, es mejor que el resultado que ofrece el traductor de Google.

Otros, como Traducción jurídica siguen recelando dada la sinonimia y tecnicidad de los textos jurídicos, como mostraban en esta imagen: 

Quise probar con un texto literario y el resultado era de esperar. Como bien dijo Jordi, estas máquinas no están pensadas para la ficción escrita y menos todavía para la audiovisual. Juzgad vosotros mismos:

Y observad la poca diferencia con Google Translate en este caso:

Como vemos, ni tiene el formato de diálogo adecuado ni el contenido acaba de fluir, por decirlo suavemente.

La posedición en TAV

Acabamos de comentar que este tipo de programas no acaban de funcionar bien con ficción y, sin embargo, precisamente esta semana me ha tocado participar en una especie de experimento para un cliente para ver si se puede aplicar la posedición en subtitulación. Para eso, el traductor debía controlar el tiempo con una aplicación como Toggl en dos etapas distintas: la primera, la traducción de un capítulo de una hora de una serie; la segunda, la posedición de la traducción automática de otro capítulo de la misma serie y con la misma duración. En ningún momento se nos ha dicho qué programa o herramienta han usado para traducir automáticamente el texto. Sí nos avisaron que podía haber discrepancias con el tiempo de entrada y salida de los subtítulos y con la segmentación. ¡Y vaya si las había!

En cualquier caso, la consigna era —en posedición— que tratáramos de tocar lo mínimo necesario y evitáramos retraducir siempre que se pudiera. ¿Se consiguió? Solo en parte. He querido recopilar aquí los resultados de esta tarea y algunos ejemplos de lo más llamativo.

Empecemos con los números y la ortotipografía. Por ejemplo, en la traducción automática se dan bastantes errores en medidas y cantidades. En un subtítulo en el que un personaje hablaba de cavar un agujero 5 feet deep, era de 5 metros en la traducción y no de metro y medio. Y en cuanto a ortotipografía, algo parecido: la traducción automática copiaba directamente el formato. En todos los casos de precios, la TA conservaba el orden anglosajón: $80 y no 80$ (no le he puesto el espacio entre número y símbolo porque no suele usarse en subtitulación: se perdería un espacio precioso).

Otros fallos recurrentes se observan en el tratamiento «tú» y «usted», que se pierde completamente, al igual que en número. Sin tener en cuenta la imagen, ese you puede ser tú o vosotros, usted o ustedes. Como sabéis, la imagen manda en TAV y es imprescindible fijarse en la imagen.

Un dato curioso más —que ignoro a qué es debido— es que muchos nombres propios, sobre todo topónimos, se escriben en minúscula. Por ejemplo, sucedía con la ciudad de Boulder, que pasaba a boulder en varios subtítulos. Afortunadamente no lo tradujo como «roca» o «peñasco» en ningún caso. Tampoco me hubiera extrañado.

Ya que hablamos de nombres propios, a veces se traducen literalmente. Barb aparece traducido como «diente» y «barbilla» en varias ocasiones. Un personaje llamado Salty pasaba a ser «salado» en tantas otras.

Al contrario de lo que se pueda pensar, sí se cometen errores ortográficos; por ejemplo, escribe aún así cuando debe ser «aun así» No distingue entre como y cómo y, curiosamente, no tildó casi ningún pronombre interrogativo. Y también lo observé en algunos pronombres personales: He loves me. ☛ El me ama.

También se observó arbitrariedad en los signos ortográficos: a veces usaba correctamente los dos y en otras, desaparecía el de apertura.

Por último, también bailaron algunas preposiciones: I want to see Albert. ☛ Quiero ver Albert. ☛ Quiero ver a Albert.

Sección especial merecen algunas frases y expresiones que sufrieron cambios bastante significativos. Veámoslas:

Original Traducción automática Traducción propuesta
Are we done? Casa patas arriba. ¿Hemos acabado?
As if I didn’t feed you. Como si no te metiera Como si no os hubiera dado de comer.
Don’t see him much anymore No lo veo mucho más. Ya no lo veo tanto.
Don’t you dare tell another soul No te atrevas a otra alma No te atrevas a decir ni mu / a abrir la boca / Como le digas a alguien…
He’s good. Es bueno. Está bien.
No. No hay. No.
Power-hungry husband Marido traga-energía Ávido de poder
Should there be? ¿Si se realiza? ¿Debería?
So help me if… Entonces ayúdame Juro que…
There’s a Little buzz going up here… Hay un ligero zumbido por ahí arriba… Se rumorea / Hay ciertos rumores…
This is just so incredibly effed up Esto está tan fuera lastimado La cosa está muy jodida
…trying to ask me… …tratando de invitarme… …quería pedirme…
What’s the hurry? ¿No puedo controlar mis deseos? ¿Qué prisa tienes?

Ahora os preguntaréis si hace algo bien. ¿Qué se traduce correctamente? Pues sobre todo las frases más sencillas sin juegos de palabras:

And I… I said I wasn’t sure. Y yo… dije que no estaba segura.
Don’t you want a life like mine? ¿No quieres una vida como la mía?
Go sit. Where’d your mom go? Ve a sentarte. ¿Dónde ha ido tu madre?
I changed my mind. I’m sorry. Cambié de opinión. Lo siento.
I have told you all this. Ya te he contado todo esto.
It’s about Marge. I need you to talk to her. Se trata de Marge.

Necesito que hables con ella.

It’s cold. Hace frío.
Just hold tight. Aguanta.
Listen to me. Escúchame.
They’re cowards. You know that. Son cobardes. Tú lo sabes.
This isn’t North Korea. Esto no es Corea del Norte.

Con las frases subordinadas se pierde un poco más:

I didn’t hear Lee say

he thought it was preposterous.

Lee no oí decir que le pareciera

absurdo.

Pero a veces sorprende con algún referente que otro:

You’d better hide the Drano, Bill,

‘cause I might drink it.

Ya puedes esconder la lejía, Bill,

‘ porque puede que me la beba.

En total, un capítulo anterior de la misma duración —1 hora, recordemos— se tradujo partiendo de cero en 9 horas 43 minutos, incluyendo las diversas revisiones que requiere este cliente. La posedición supuso 7 horas 6 minutos. Nos hemos ahorrado alrededor de 2 horas 30 minutos. ¿Vale la pena? Pues por dos horas yo creo que no, sinceramente (el cliente, ya no sé).  Hay que estar mucho más pendiente que si fuera una revisión normal. Piden que no se toque en exceso y que se evite retraducir, pero muchas veces no queda otra.

En general, sí me parece que hay que ser algo recelosos con el desarrollo y perfeccionamiento de estos programas, pero de momento no debe quitarnos el sueño. Por lo que sí deberíamos luchar ahora es por unas tarifas de posedición dignas (repetimos: no son simples revisiones) y pensar que nada es la panacea.

De algún modo pienso que un sistema de TA es como un(a) Roomba. No puedes encenderla sin más y esperar que te lo deje todo completamente limpio. Primero debes procurar que no haya nada que obstaculice su paso, recoger un poco y luego seguramente veas que ha quedado un rinconcito por aspirar. ¿Que por qué os hablo de esto? Pues porque para que un sistema de traducción automática funcione realmente bien tiene que haber un buen trabajo previo en el texto: hay que escribir para la máquina, de algún modo, y se debe comprobar que el texto esté bien escrito, que no haya errores, etc. Me pregunto si añadiendo todo esto en la ecuación (primera revisión completa del texto + traducción automática + posedición) nos ahorramos tiempo realmente, pero eso ya es otro debate.

Para resumir un poco todo esto, me quedo con las palabras de Ben Screen en este artículo: «Today, machine translation can create rough drafts of relatively simple language, and research shows that correcting this draft is usually more efficient than translation from scratch by a human. But machines do not now – and it is questionable whether they ever will be able to – replace a translator’s brain. No matter how complex the code behind it, an automated system would struggle to get the same sense of the words».

Y a vosotros, ¿qué os parece todo esto?

***

Algunos artículos más para reflexionar:

  • ¿Es Google Translator el Aníbal Lecter de los traductores? por Xosé Castro
  • ¿Es la traducción automática una amenaza para el traductor profesional? por Enrique Torrejón.
  • Poseditores: ¿Por qué la traducción automática en crudo necesita posedición? En Pangeanic.

Traducción automática para dummies

26 jueves Jul 2012

Posted by enlalunadebabel in Lengua española, Traducción

≈ 10 comentarios

Etiquetas

castellano, catalán, errores, errors en català, machine translation, MT, TA, traducción, traducción automática

Cuando la gente piensa en un traductor automático piensa en esto, una especie de robot que traduce al momento una frase o un texto entero de una lengua a otra.

(De hecho, esto es una instalación llamada ‘bios [bible]’ (2007) de Robotlab que consiste en un robot industrial que escribe la Biblia en papel trazando las líneas caligráficas con una precisión excepcional.)

Pero en realidad se asemeja más a esto otro (y no solo por el error que ha producido al traducir del alemán al inglés):

Como todo, un traductor automático puede ser algo positivo si se usa bien, como un superhéroe hace con sus poderes. Por ejemplo, puede resultar de ayuda para cualquier persona que desee comprender rápidamente (y sin muchas pretensiones) un texto escrito en una lengua que desconoce. Ahora bien, y nunca me canso de recalcarlo: en caso de duda, consulte a un especialista.

Últimamente son muchos los traductores que, con miras a optimizar el trabajo de traducción, emplean también este tipo de programas. Por ejemplo, existen programas que se pueden usar conjuntamente con Trados, como el GT4T, que permite hacer una pretraducción del segmento con Google Translate.

No obstante, para entregar un producto de calidad, la interacción hombre-máquina debe seguir (idealmente) unos parámetros: preedición, edición interactiva y postedición. En la fase de preedición, el traductor revisa el texto que se va a traducir antes de que éste lo introduzca en la máquina con el fin de resolver ambigüedades que puedan existir en el texto. La edición interactiva consiste en realizar la traducción de manera que, durante el proceso, la máquina entregue opciones al traductor para que éste determine la mejor solución en cada caso. Finalmente, la postedición consiste en “corregir” el producto resultante del programa de TA, y es una de las fases más usadas en los diferentes programas que existen en el mercado. Esto último es esencial si no se quiere meter la pata hasta el corvejón.

Tipos de traductores automáticos 

Hay que matizar que no todos los traductores automáticos son iguales. Según M. Isabel Diéguez (cuyos estudios sobre los errores y los aciertos de los sistemas de TA son dignos de leer y se han tomado de base para el post) hay que distinguir los tipos de programas:

  1. Sistemas autónomos que requieren una edición posterior del texto traducido a cargo de un traductor humano;
  2. Sistemas interactivos, ya sea de TA asistida por el usuario o traducción manual asistida por el computador, y
  3. Sistemas más independientes, entre los cuales podemos destacar los sistemas de gestión de bases de datos terminológicos, los programas de vaciado automático de términos y los programas de TA dotados de un módulo de terminología.

La calidad en el punto de mira

En lo referente a la calidad, se han hecho estudios comparativos de diferentes programas de TA cuyos resultados no son del todo alentadores en comparación con la calidad que presentan las traducciones hechas por el traductor humano, evidentemente. Algunos investigadores reconocen que la calidad del producto de un programa de TA depende fundamentalmente de variables como la cantidad y grado de fiabilidad de la información terminológica que el programa contenga (básico). En otras palabras, reconocen que la calidad aumenta en la medida en que el programa cuente con un glosario general y con varios microglosarios especializados según áreas temáticas.

Además, está claro que no es lo mismo un traductor en línea como Babelfish, Bing, que el traductor de El Mundo (aprovecharon el software de Reverso), el de Google Translate o el de Systran.

Errores típicos

Algunos de los errores más típicos, según se recogen en este estudio de Esperanza Alarcón, son:

  1. Imprecisiones terminológicas (estos programas suelen contener el vocabulario más general y no contemplan los términos más especializados que, además, pueden variar de una rama a otra)
  2. Falsos sentidos
  3. Sinsentidos
  4. Palabras sin traducir (a veces se dejan en la lengua original aquellas palabras que no se encuentran recogidas en el programa o bien si contienen erratas)
  5. Repeticiones
  6. Alteración del orden de las palabras
  7. Uso incorrecto de las preposiciones (pasa mucho con el «à» del francés)
  8. Uso incorrecto de los tiempos verbales
  9. Traducción incorrecta de la doble negación en francés y catalán
  10. Calcos sintácticos y léxicos de la LO
  11. Extranjerismos innecesarios
  12. Alteración de la puntuación

Casos reales

Las mayores barbaridades que he observado se producen especialmente en lenguas muy cercanas, por ejemplo el castellano y el catalán. En estos casos me parece que el motivo principal son las prisas y la desidia porque no se entiende que se produzcan fallos garrafales como los que se recogen a continuación.

Veamos la siguiente fotografía. Es el escaparate de una panadería y entre los tipos de pan está el «pa engonals» que, en español sería «pan inglés». Por lo visto teclearon «pan ingles» (así, sin acento) en el traductor de Google y creyeron a pies juntillas en la propuesta del programa.

En el caso siguiente el error se debe a que el programa no distingue entre palabras polisémicas si no se da un contexto claro e incluso a veces a pesar de tenerlo. «Empeño» en castellano es (según la RAE) la «acción y efecto de empeñar un objeto» o bien «deseo vehemente de conseguir algo», entre otros significados. Pues bien, a la hora de trasvasar su sentido al catalán, este establecimiento ha optado por el segundo significado, que no tiene ningún sentido aquí. La palabra adecuada seria «empenyorament». Además, en el escaparate se mezcla el castellano y el catalán, pero eso es otro tema.

Ocurre tres cuartos de lo mismo en el siguiente adhesivo en un escaparate de una tienda de ropa. Se supone que regalan una bolsa para la playa pero al traducirlo literalmente (me niego a pensar que lo ha traducido una persona) ha quedado en «borsa», que en catalán equivale a «la Bolsa».

En las cartas de los restaurantes abundan este tipo de errores que huelen a traducción automática. Este es de juzgado de guardia:

Los callos (de vaca, ternera o carnero) han pasado a ser callos (de pies humanos) en esta carta. ¿Da miedo o no?

Para terminar os dejo unos pantallazos de la técnica «depurada» que tiene Microsoft en cuanto al uso del traductor automático en su página. Este es el original:

Y esta la versión castellana del Knowledge Base hecha con un TA:

Al menos tienen la decencia de avisar de que se trata de una traducción automática y que «no garantizan la calidad lingüística de las traducciones». Algo es algo, pero podrían contratar a un traductor de carne y hueso, ¡leñe!

Y, como no, veamos lo que hace Google:

¡Sin palabras! Google Translator sí es un buen bicho…

Y a los compañeros traductores os pregunto: en vuestro trabajo ¿TA sí o TA no?

¡Hasta la próxima!

***

Para saber un poquito más:

  • María Isabel Diéguez. 1998. Análisis del error en la traducción automática: algunos ejemplos de las formas -ing del inglés al español. / 2001. Aciertos y errores en la traducción automática: metodología de la enseñanza-aprendizaje de la traducción humana.
  • Joseba Abaitua. 2001. Introducción a la traducción automática (en 10 horas). Grupo DELi, Universidad de Deusto.
  • Victoria López. 2002. Posibilidades y realidades de la Traducción Automática traducción.rediris.

Errores y horrores

30 lunes Abr 2012

Posted by enlalunadebabel in Off topic, Traducción

≈ 5 comentarios

Etiquetas

errores, fails, google translate, traducción, traducción automática

Sé que no es muy original y que en los blogs de traducción es algo recurrente, pero nunca está de más echarse unas risas al ver lo que pasa cuando se usa un traductor automático o no se revisa lo que se hace. Los traductores humanos no somos perfectos pero fiarse únicamente de las maquinitas puede traer problemas.

Encabezando el top 10 propongo el traductor de El Mundo. Aquí hay un pantallazo con tres frases que no tienen desperdicio. No se me ocurre qué variables le han introducido al programa para que traduzca «averiado» con «lost virginity», para empezar. Lo del «duro» tiene cierto pase si tenemos en cuenta los distintos significados de una palabra, algo muy difícil de discernir para un programa y en el caso de «puto amo», ha traducido en el mismo orden palabra por palabra, y ahí está el resultado:

El siguiente tiene que ver con una traducción automática no revisada. Alguien le dio al botoncito de traducir y debió de pensar que lo que le salía en pantalla era la traducción cuando, en realidad, el proceso había fallado. Tough luck!

El siguiente vuelve a ser más de lo mismo. Aquí teclearon directamente «vino», cuando puede ser un sustantivo (la bebida) o una forma del verbo «venir». El programa les proporcionó la segunda acecpión y así se quedó.

El siguiente es uno de mis preferidos, seguro que ya lo habréis visto. No sabía que la plancha era un «hierro chulo». A mí no me lo parece cada vez que me toca abordar la montaña de plancha que siempre termino acumulando…

El siguiente fail tiene que ver, una vez más, con la polisemia. En castellano, «pasar» puede significar tanto «entrar» como «suceder» y el error al escoger el significado adecuado propició el «not to happen» al hacer la traducción inversa al inglés:

Y bueno, este último, ya no sé si se ha traducido automáticamente o lo ha hecho alguien (seguramente la sobrina de alguien que sabe inglés) diccionario en mano y sin fijarse en las palabras que cogía. «¿Entradas ya a la venta? Pues busco «entrada» y la primer acepción es «entrance», ¡ahí lo dejo! A ver, a ver, ¿cómo digo «sin colas»? Busco «cola» y lo primero que me sale es «tail», pues ale.

Reconozco que los traductores somos bastante tiquismiquis en lo que a malas traducciones y faltas de ortografía se refiere, pero es que hay algunas que son «de juzgado de guardia».

Entradas recientes

  • El lenguaje de la noche
  • Juego en el trono
  • Cómo plantear una subida de tarifas
  • End of the year… when you’re a freelancer
  • Lo que dio de sí el #CongresoASATI

Archivos

Tweets

  • Todo esto es terrorífico. twitter.com/surrealitybyte… 2 hours ago
  • @Paseando_pags A mí me regalaron uno esta Navidad, pero aún no lo he empezado. Los tienes en Milbby, en Abacus y de… twitter.com/i/web/status/1… 4 hours ago
  • @MaresiaLibros @IngaPellisa Enhorabuenísima a las dos. ♥ 4 hours ago
  • @mjnegueruela1 @tradurietas @CarlosMayor @COMIC_bcn Pues claro. Además, anima mucho ver que hay interés. :-D 4 hours ago
  • RT @tradurietas: Recordad que el domingo 2 de abril a las 16:00 tenéis una cita con @CarlosMayor y @Scheherezade_SL en el #41ComicBCN @COMI… 4 hours ago
Follow @Scheherezade_SL

Traducción

  • Algo más que traducir
  • De traducciones y otras rarezas
  • El arte de traducir
  • El blog de Mar Traducciones
  • El taller del traductor
  • El traductor en la sombra
  • La paradoja de Chomsky
  • Localización y testeo con Curri
  • No disparen al traductor
  • Nobody is perfect
  • Traducirco
  • TraducThor, la fuerza de las palabras

Categorías

Meta

  • Registro
  • Acceder
  • Feed de entradas
  • Feed de comentarios
  • WordPress.com

Temas y conceptos

calcos castellano cómic cómo ser traductor autónomo diccionarios doblaje empezar a traducir emprender errores inglés lengua literatura productividad recursos subtitulación TAV traducción traducción audiovisual traducción editorial traducción erótica traducción literaria traductor traductor autónomo traductor novel traductor principiante

Enter your email address to follow this blog and receive notifications of new posts by email.

Únete a otros 122.734 suscriptores
Follow En la luna de Babel on WordPress.com

Estadísticas

  • 2.039.616 lunáticos

Las 1001 traducciones

Las 1001 traducciones
Top 25 Language Professional Blogs 2016
Top 25 Language Facebook Pages 2016
Top 25 Language Twitterers 2016

Entradas y Páginas Populares

  • Cómo encontrar tu primer encargo de traducción y no desfallecer en el intento
  • Sexo oral y escrito: argot, eufemismos y etimología
  • La puntuación inglesa y española. Similitudes y diferencias
  • El traductor insolente: traducir el lenguaje soez
  • El lenguaje escatológico y sus eufemismos
  • Pinceladas de lengua: las onomatopeyas y las voces de los animales
  • La sinonimia en traducción
  • Trucos y herramientas para la revisión de traducciones
  • El lenguaje de la noche
  • Maquillaje lingüístico: los eufemismos

Blog de WordPress.com.

  • Seguir Siguiendo
    • En la luna de Babel
    • Únete a 1.911 seguidores más
    • ¿Ya tienes una cuenta de WordPress.com? Accede ahora.
    • En la luna de Babel
    • Personalizar
    • Seguir Siguiendo
    • Regístrate
    • Acceder
    • Denunciar este contenido
    • Ver sitio web en el Lector
    • Gestionar las suscripciones
    • Contraer esta barra
 

Cargando comentarios...