Hace unos cuantos días, Google anunció que su traductor se iba a actualizar con una función para transcribir y traducir en tiempo real. En pocas palabras, Google ha implementado una función similar a lo que hace la app "Transcripción instantánea" en su app de traductor, por lo que ahora el traductor viene a funcionar también como un intérprete en tiempo real. Dijeron que llegaría a lo largo de los próximos días, y el momento ha llegado.

En Xataka hemos recibido la actualización que activa la transcripción en un Google Pixel 2 XL con la última versión de Android 10 disponible. La versión concreta es la 6.6.1. En iOS, por el momento, no nos aparece. Para ver cómo se comporta como "intérprete de bolsillo", lo hemos probado y sometido a algunas pruebas. He aquí el resultado y nuestra experiencia.

Los idiomas disponibles

Antes de comenzar, cabe hacer una mención a los idiomas que hay disponibles en esta función. Google Traductor es compatible con unos 100 idiomas, pero la función "Transcribir" solo funciona con unos cuantos. En ocho, para ser exactos. Son idiomas muy extendidos, así que de alguna forma tiene sentido que para el lanzamiento se haya optado por hacerlo así.

¿Y cuáles son los que hay disponibles en este momento? Pues son el alemán, español, francés, hindi, inglés, portugués, ruso y tailandés. Faltan algunos importantes, como el chino, el japonés o el italiano, pero usando el inglés como intermediario lo cierto es que la función es, simplemente, suficiente. Sobra decir que solo se puede usar un idioma de entrada y otro de salida, así que por ahora nada de traducir simultáneamente a varios idiomas.

Aunque aparece la opción para descargar los idiomas, lo cierto es que la función "Transcribir" no funciona sin una conexión de datos o WiFi activa, lo que deja ver que el procesamiento de voz se está llevando a cabo en la nube. Esto puede ser un pequeño problema a la hora de viajar a un país sin roaming, así que debe tenerse en cuenta.

La experiencia de uso

¿En qué contexto se podría usar esta función? Por ejemplo, para ver una charla en inglés sin subtítulos o con subtítulos en inglés, o para transcribir un mensaje en español a otro idioma que no conoces o que no dominas con soltura. Para el caso, hemos hecho las siguientes pruebas:

Leer en español los dos primeros párrafos del libro 'Homo Deus', de Yuval Noah Harari. Transcribir el primer minuto del discurso de Steve Jobs en la Universidad de Stanford (por el simple motivo de que es fácil encontrar una transcripción ya hecha).

La idea, más allá de comprobar la precisión del sistema y si respeta la puntuación, es ver la velocidad de respuesta, cuánto tiempo tarda en ofrecer la traducción.

Los dos primeros párrafos de 'Homo deus' dicen lo siguiente. Han sido leídos en voz alta a un ritmo normal, ni muy rápido ni muy lento, y haciendo las pausas correspondientes.

"En los albores del tercer milenio, la humanidad se despierta, estira las extremidades y se restriega los ojos. Todavía vagan por su mente retazos de alguna pesadilla horrible. «Había algo con alambre de púas, y enormes nubes con forma de seta. ¡Ah, vaya! Solo era un mal sueño». La humanidad se dirige al cuarto de baño, se lava la cara, observa sus arrugas en el espejo, se sirve una taza de café y abre el periódico. «Veamos qué hay hoy en la agenda». A lo largo de miles de años, la respuesta a esta cuestión permaneció invariable. Los mismos tres problemas acuciaron a los pobladores de la China del siglo XX, a los de la India medieval y a los del antiguo Egipto. La hambruna, la peste y la guerra coparon siempre los primeros puestos de la lista. Generación tras generación, los seres humanos rezaron a todos los dioses, ángeles y santos, e inventaron innumerables utensilios, instituciones y sistemas sociales…, pero siguieron muriendo por millones a causa del hambre, las epidemias y la violencia. Muchos pensadores y profetas concluyeron que la hambruna, la peste y la guerra debían de ser una parte integral del plan cósmico de Dios o de nuestra naturaleza imperfecta, y que nada excepto el final de los tiempos nos libraría de ellas".

Google Traductor nos devuelve casi en tiempo real la siguiente traducción. La he copiado y pegado tal y como me la ha devuelto la app:

"at the dawn of the third millennium, humanity wakes up stretches its limbs and rubs its eyes still go through its mind scraps of a horrible nightmare there was something with barbed wire and some huge mushroom shaped, go just was a bad dream the humanity goes to the bathroom it washes its face it observes its wrinkles in the mirror it is served a cup of coffee and it opens the newspaper, we see that there is today on the agenda for thousands of years, the answer to this question remains unchanged The same problems accused the people of 20th century China to those of medieval India, that of ancient Egypt, famine, war always took the top of the list, generation after generation, humans prayed to all gods, angels. and saints invented innumerable utensils, titles and social systems, but epidemics and violence followed from hunger, many thinkers and prophets concluded that famine, plague and war should be an integral part of God's Cosmic Plan or our imperfect nature and end of time would rid us of them.

Como podemos ver, en lo que precisión se refiere no se le pueden poner demasiadas quejas. Es cierto que erra en la puntuación, que evidentemente no distingue cuando leemos un entrecomillado y que faltan algunas comas y puntos, pero el texto es legible y comprensible. No es una transcripción perfecta, pero es más que suficiente para que una persona que no maneja el castellano entienda la idea que queremos transmitir. Para ver cómo funciona por ti mismo, he aquí un vídeo:

Pasamos así al discurso de Steve Jobs, que podría ser un caso extrapolable a transcribir una clase en otro idioma, un curso o cualquier charla que encontremos por Internet. El fragmento de audio que hemos utilizado dice lo siguiente:

"Thank you. I am honored to be with you today at your commencement from one of the finest universities in the world. I never graduated from college. Truth be told, this is the closest I’ve ever gotten to a college graduation. Today I want to tell you three stories from my life. That’s it. No big deal. Just three stories. The first story is about connecting the dots. I dropped out of Reed College after the first 6 months, but then stayed around as a drop-in for another 18 months or so before I really quit. So why did I drop out? It started before I was born. My biological mother was a young, unwed college graduate student, and she decided to put me up for adoption. She felt very strongly that I should be adopted by college graduates, so everything was all set for me to be adopted at birth by a lawyer and his wife".

La traducción, que aparece más rápido que en la anterior prueba, es la siguiente:

"Gracias. Me siento honrado de estar con ustedes hoy para comenzar en una de las mejores universidades del mundo. A decir verdad, nunca me gradué de la universidad y esto es lo más cerca que he estado de una graduación universitaria. Hoy quiero contarte tres historias de mi vida. Eso es. No es gran cosa. Solo tres historias. La primera historia es sobre conectar los puntos. Dejé el Reed College después de los primeros seis meses, pero luego me quedé por otros 18 meses más o menos antes de dejar de fumar. Entonces, ¿por qué me salí? Todo comenzó antes de que yo naciera. Mi madre biológica era una joven estudiante de posgrado soltera y decidió ponerme en adopción. Ella sentía muy fuertemente que debería ser adoptado por graduados universitarios. Así que todo estaba listo para que un abogado y su esposa me adoptaran en Birth."

Como podemos comprobar, es bastante más precisa que en la prueba anterior y detecta mucho mejor la puntuación, posiblemente porque el idioma de entrada es el inglés. Hay algún que otro fallo puntual, pero en líneas generales, se podría decir que es más que correcta. La velocidad a la que Google nos muestra la transcripción es aceptable. No inmediata, pero más que suficiente para ir siguiendo el hilo de lo que se está diciendo. De nuevo, el vídeo:

En resumen, la función "Transcribir" funciona bastante bien y desde luego soluciona la papeleta de tener que entender una charla larga en otro idioma. También es útil para traducir casi en el momento nuestro idioma a otro de los ocho compatibles, y si bien es cierto que faltan algunos idiomas, siempre está el recurso de traducir al inglés, que es un idioma, entre comillas, "universal".

Habría agradecido algo más de velocidad, pero con la que hay es suficiente para seguir el hilo de una conversación o ponencia. También me habría gustado que el sistema funcionase sin conexión, pero para ser una primera versión el sistema funciona correctamente. Como decía antes, esta función solo está disponible en Android por ahora.