Hogar Opiniones Cómo ai, ml transformará las traducciones de voz a texto y lenguaje | tim bajarin

Cómo ai, ml transformará las traducciones de voz a texto y lenguaje | tim bajarin

Video: TRANSCRIBE cualquier audio: de VOZ a TEXTO con estas Apps (Noviembre 2024)

Video: TRANSCRIBE cualquier audio: de VOZ a TEXTO con estas Apps (Noviembre 2024)
Anonim

Una de las demostraciones más impresionantes en Google I / O fue Duplex, una inteligencia artificial que hacía llamadas a lugares de negocios, en este caso una peluquería y un restaurante, para reservar citas. Los humanos en el otro extremo de la línea aparentemente no eran más sabios, y Duplex manejó los desafíos con facilidad, como cuando el restaurante dijo que no aceptaba reservas para fiestas pequeñas.

Este anuncio de IA en particular obtuvo mucha cobertura en Google I / O, pero la IA y el aprendizaje automático prevalecieron en todos los productos y servicios mostrados en la conferencia de desarrolladores. Basta con mirar este gráfico, que Google mostró en un evento de analistas centrado en la IA el día antes de la apertura de E / S.

En ese evento se mostraron otras dos cosas que considero posibles cambiadores de juego.

El primero es cómo se aplica la IA a la traducción de voz a texto. El objetivo es lograr una precisión del 99 por ciento con IA y ML en los próximos años. Dicho esto, las demostraciones en las que dictaban comentarios en varias aplicaciones de G-Suite ya eran bastante precisas. También vimos una demostración más detallada de Smart Compose, donde una persona escribe una oración en Gmail, y Smart Compose escribe la siguiente oración para usted según el contexto de la primera oración.

Varios productos de reconocimiento de voz, como Dragon Dictate, han estado en el mercado durante años. Pero estos programas se basaron en software localizado y aprovecharon la potencia de procesamiento actual disponible en el momento de cada lanzamiento. Estos programas mejoraron con los años, pero si agrega AI y ML, la tasa de precisión seguramente mejorará.

Google comprende la importancia de la conversión de voz a texto en su vida cotidiana. Una interfaz precisa de voz a texto es fundamental al responder un mensaje mientras conduce. Es una forma significativa de responder a un correo electrónico o mensaje de texto en dispositivos portátiles o teléfonos inteligentes. Eventualmente se convertirá en un aporte valioso cuando se usan lentes de realidad mixta, donde se necesita usar la voz como parte del proceso de navegación y voz a texto para varios tipos de aplicaciones AR.

El segundo es cómo se usan AI y ML en Google Translate, que será realmente transformador cuando las traducciones se realicen en tiempo real. Como viajero internacional que solo habla inglés, este tipo de traducción sería una bendición. Hay algunos dispositivos portátiles que intentan traducir lo que usted dice a un idioma local, pero actualmente tienen muchas limitaciones.

Google está atento a este tipo de traducción, por lo que es seguro decir que podríamos ver algunos avances reales en la traducción de idiomas más precisa en teléfonos Android en breve. Apple también tiene investigaciones de IA y ML sobre varios aspectos de la traducción de voz y texto, por lo que también, junto con socios potenciales, podría ofrecer una solución de traducción de idiomas móvil en iOS algún día.

AI y ML tendrán un impacto dramático en la traducción de voz a texto, y su efecto más destacado puede ser como parte de la interfaz de usuario en AR y VR o gafas de realidad mixta. Personalmente, las traducciones de idiomas me entusiasman más, ya que facilitaría mi viaje por el mundo.

Cómo ai, ml transformará las traducciones de voz a texto y lenguaje | tim bajarin