Hogar Opiniones El santo grial de la traducción de voz, ahora en skype | juan c. dvorak

El santo grial de la traducción de voz, ahora en skype | juan c. dvorak

Video: Como Utilizar Skype Translator (Noviembre 2024)

Video: Como Utilizar Skype Translator (Noviembre 2024)
Anonim

Si siguió la revolución de la computadora desde el inicio del microprocesador, sabría que hay una serie de promesas iniciales que aún no se han cumplido.

Uno de ellos es el discurso traducido sobre la marcha, donde dices algo en inglés y se repite en otro idioma, como el español, casi en tiempo real. Aunque todavía es un trabajo en progreso, Microsoft ahora está un paso más cerca con Skype Translator, cuya primera fase se puso en marcha esta semana.

Si esto se acerca al trabajo y no es una broma, es el producto de la década. En este momento, Skype Translator admite traducciones de español a inglés y de inglés a español, pero hay más idiomas a seguir.

El problema típico con este tipo de cosas es el escandaloso nivel de dificultad. Todavía tengo que ver un paquete de traducción decente que haga traducciones de texto a texto que funcionen bien. La traducción de voz tiene un nivel de dificultad completamente diferente, especialmente en tiempo real.

Microsoft tiene una película que muestra a dos niños hablando en español e inglés que parece que funciona bien. Pero vi un sistema similar demostrado por IBM hace casi 20 años que nunca vio la luz del día. La versión de IBM se desarrolló en la década de 1990, cuando hubo una manía de reconocimiento de voz dirigida por Lernout & Hauspie, una empresa que se declaró en quiebra, antes de quebrar por un escándalo de fraude en 2001. Antes de eso, sin embargo, estaba comprando todas las tecnologías de voz. empresa que podría, incluidos Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone y otros. Microsoft tenía una participación del 8 por ciento en L&H y terminó con algunas de las tecnologías como un regalo de despedida por bancarrota.

Ahora aparece Skype Translator de repente. ¿Coincidencia? Cualquiera sea el caso, toda esta tecnología ha tardado demasiado en llegar a este punto.

Mire las miserables traducciones de computadora de texto a texto hechas por Google y otros. El texto no evita ni puede evitar el más obvio de los errores. Nada de esto se acerca a la complejidad de la traducción del habla, lo que implica un procesamiento de señal pesado.

Soy coleccionista de vinos y visito con frecuencia sitios web de bodegas francesas. Mi francés solo está bien, así que a menudo enciendo la traducción para acelerar la lectura del sitio. Aquí estamos en 2014 y ninguno de los traductores puede darse cuenta de que la traducción de Château Margaux es Château Margaux, no Castle Margaux. ¿Qué tan difícil es abstenerse y no traducir una palabra de uso común usada en un nombre propio, como château, que generalmente se refiere a una bodega específica, a la palabra castillo? Al parecer es imposible. Todos lo hacen

¿Qué tan difícil es escribir alguna excepción en el código que le dice al traductor que está en un sitio web sobre vino de Burdeos? Mientras esté en ese sitio, la palabra castillo no significa castillo. A menudo, el traductor intentará decodificar el resto del nombre del castillo también, con resultados ridículos. Lo mejor que puede hacer generalmente con la traducción de texto es tener una idea de lo que dice el sitio.

Pregúntese: si el texto es tan difícil, ¿cómo gestionará Microsoft el habla?

Es casi imposible incluso en el mismo idioma. Tome el servicio telefónico de Google Voice. Tiene una función de toma de mensajes de voz a texto. Nunca recibí un mensaje de voz a texto que incluso se acerca a lo que la persona realmente dijo. Ni una sola vez.

Admito que en una habitación tranquila cuando hablas clara y claramente, el reconocimiento de voz funciona bien. Lo uso para mensajes de texto en mi teléfono Android. Pero en una conversación real, nadie habla así. Admiro a Microsoft por implementar esto. Pero no funcionará como se anuncia.

Dicho esto, es al menos algo con lo que jugar. Incluso podría desencadenar una nueva generación de investigación. Entonces no me quejaré demasiado.

Todos quieren esto. Volvamos a trabajar en ello.

El santo grial de la traducción de voz, ahora en skype | juan c. dvorak