Hogar Opiniones Ai es (también) una fuerza para el bien | ben dickson

Ai es (también) una fuerza para el bien | ben dickson

2024

Tabla de contenido:

Cómo el aprendizaje profundo genera voces humanas
Recreando la voz de una persona sin voz
Equilibrando los usos negativos de los sintetizadores de IA

Video: The Wild Project #22 feat Dot CSV (Experto en Inteligencia Artificial) | Robots, ¿Nos espían? (Noviembre 2024)

En 2017, la esclerosis lateral amiotrófica (ELA), un desorden neurológico devastador, le robó a Pat Quinn, el fundador del famoso Ice Bucket Challenge, su habilidad para hablar.

En 2018, la inteligencia artificial lo ayudó a recuperarlo.

Gracias a los avances en el aprendizaje automático y el aprendizaje profundo, los algoritmos de inteligencia artificial se han vuelto muy buenos para imitar a los humanos. Pero si bien muchos desarrollos destacados en el espacio han sido negativos, el poder de imitación de AI fue una fuerza de cambio positivo para Quinn.

"La mayoría de las personas que viven con ELA (también conocida como enfermedad de la neurona motora) terminan paralizados e incapaces de comunicarse con cualquier otra cosa que no sean voces artificiales 'de computadora'", dice Oskar Westerdal, cofundador de Project Revoice, una iniciativa que tiene como objetivo ayudar a pacientes con ELA como Quinn.

Para recrear la voz de Quinn, Project Revoice colaboró con Lyrebird, una de las pocas compañías que usan IA para clonar la voz de una persona, un grupo que también incluye WaveNet y Voicery de Google, una startup respaldada por Y Combinator que usa AI para crear grabaciones de voz sintetizadas..

Cómo el aprendizaje profundo genera voces humanas

Detrás de estas aplicaciones están los algoritmos de aprendizaje profundo, una rama popular de IA que examina grandes conjuntos de datos para obtener información y patrones que no se pueden capturar con el software tradicional basado en reglas. Cuando entrena un sintetizador de voz de aprendizaje profundo con suficientes grabaciones de voz, crea un modelo digital que representa la voz de la persona y puede generar nuevas muestras de voz.

Antes del advenimiento de la tecnología de síntesis de voz impulsada por IA, los pacientes con ELA tenían que usar voces digitales genéricas que no eran las suyas. Otras tecnologías podrían unir oraciones pregrabadas con la voz del paciente, pero los resultados fueron demasiado artificiales y requirieron decenas de horas de grabaciones de voz para ser de uso mínimo.

Las aplicaciones de aprendizaje profundo, por otro lado, requieren mucha menos información y proporcionan mejores resultados. "Lo que Lyrebird puede lograr con solo un par de horas de audio es notable: les da a las personas un clon de voz digital completo, para que puedan decir lo que quieran", dice Westerdal.

Recreando la voz de una persona sin voz

Uno de los límites de las aplicaciones de aprendizaje profundo es su dependencia de muestras de datos de alta calidad para entrenar sus redes neuronales. El problema con los pacientes con ELA es que una vez que pierden la voz, es imposible grabar muestras de voz. Afortunadamente, Quinn tuvo horas de notas clave grabadas y entrevistas.

"El mayor desafío era la calidad. Esta tecnología depende completamente de tener grabaciones consistentes y de alta calidad que también sigan un guión exacto, por lo que tuvimos que trabajar con un estudio de sonido para 'remasterizar' manualmente y transcribir cada línea de diálogo que pudiéramos encontrar. de Pat ", dice Westerdal.

"Teníamos un poco de miedo de no poder proporcionar una gran calidad para crear la voz de Pat", dice José Sotelo, cofundador de Lyrebird. "Como no pudimos obtener grabaciones limpias, la calidad final de la voz artificial no es perfecta. Creemos que podemos hacer un trabajo mucho mejor con grabaciones limpias".

Los resultados todavía suenan un poco antinaturales y sintéticos. Pero para Quinn, que había estado usando una voz genérica para comunicarse, la diferencia fue dramática. "¡Después de escuchar mi voz a través de esta nueva tecnología, me quedé impresionado! Para que los pacientes sepan que pueden tener su propia voz después de que ALS se la quite, cambiará la forma en que las personas viven con ALS", dice.

Quinn recomienda que los pacientes con ELA graben sus voces antes de que sea demasiado tarde. "Después de escuchar mi propia voz nuevamente, necesito que los pacientes con ELA sepan que grabar su voz es increíblemente importante", dice.

Equilibrando los usos negativos de los sintetizadores de IA

A principios de este año, FakeApp, una aplicación de intercambio de caras con tecnología de IA, desencadenó una avalancha de videos pornográficos falsos con celebridades y políticos. Existe la preocupación de que aplicaciones como FakeApp y Lyrebird inicien una nueva era de noticias falsas, fraude y falsificación.

La página de ética en el sitio web de Lyrebird reconoció anteriormente que la tecnología podría "potencialmente tener consecuencias peligrosas, como diplomáticos engañosos, fraude y, en general, cualquier otro problema causado por el robo de la identidad de otra persona".

Para entender el punto, el sitio web de la compañía presenta varias grabaciones sintetizadas creadas con las voces de Donald Trump y Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4 de septiembre de 2017

La historia de Quinn podría ayudar a arrojar luz sobre los aspectos positivos de una industria que ha sido criticada por los usos potencialmente espeluznantes y poco éticos de sus aplicaciones. "Es importante que las personas se den cuenta del lado positivo de esta tecnología", recuerda Sotelo de Lyrebird.

Además de los usos médicos, las aplicaciones de sintetizador de IA pueden cumplir otros objetivos productivos. Voicery proporciona a las marcas voces digitalizadas personalizadas con algoritmos de inteligencia artificial. Google también está experimentando con WaveNet para proporcionar una experiencia más natural a los usuarios de sus dispositivos con Google Assistant. Otras áreas donde la tecnología es útil incluyen la automatización de audiolibros o hacer que el doblaje de voz en películas sea mucho más fácil.

Sin duda surgirán obstáculos éticos y legales y los debates continuarán. Pero para Quinn, la IA es una fuerza para el bien. "No quiero sonar como una computadora", dice. "Quiero sonar como yo".