Estamos más cerca de "salvar" nuestra voz mediante la IA. Y es un paso de gigante para la medicina

voz
10 comentarios Facebook Twitter Flipboard E-mail

A Ron Brady le diagnosticaron ELA a los 52 años. Esta terrible enfermedad neurodegenerativa acaba provocando en muchos casos la pérdida total de moverse, respirar o hablar. Brady, que ahora tiene 55 años, no puede tragar ya cuando come y le es difícil hacer muchas cosas, pero como indican en The Washington Post, hay una que no ha perdiod: su voz.

Recrear el habla. Una empresa llamada Voice Keeper obra este particular milagro. Su tecnología, basada en inteligencia artificial, logra registrar, recrear y luego almacenar voces que luego se usan en sistemas de software de dictado. En este caso, Brady es capaz de hablar en estos momentos escribiendo lo que quiere decir en un teclado. "Lo que más me gusta decir es cualquier cosa cursi de padre que haga reír a mi mujer o a mis hijos adultos", afirma.

Una bendición para quienes pierden el habla. Este tipo de procesos eran caros y consumían ingente cantidad de tiempo y recursos, pero la IA ha hecho que sean mucho más accesibles y sean especialmente útiles para pacientes de ELA, cáncer de garganta, parálisis cerebral o enfermedad de Parkinson. Todos ellos son gracias a esta opción recuperar esa confianza a la hora de comunicarse con el mundo.

Una idea que ya llevaba años fraguándose. En 2016 hablábamos de Smartstones (ahora Cognixion), una empresa que combinaba un dispositivo EEG y una aplicación llamada prose (ahora Speakprose) que permitía convertir el pensamiento en habla. Era otra opción prometedora para pacientes de ELA o autismo y luego surgieron otras, pero lo que está claro es que la IA ha llevado este tipo de soluciones a un nuevo nivel.

Cómo ayuda la IA. Hasta ahora capturar el habla humana requería que la persona grabara entre 1.000 y 6.000 frases (hasta 30 horas de audio) para poder luego generar cualquier sonido en un idioma. Los resultados eran aceptables, pero no ideales. Es el caso de Ruth Brunton, que usaba una voz sintetizada de Microsoft llamada "Heather" que no se parecía apenas a su voz. Tras intentar de nuevo generar su voz con una IA, el resultado fue asombroso para ella: de no usar aquella primera voz salvo por necesidad, la nueva voz sintética fue para ella como recuperar aquello que había perdido.

Cómo la IA lo ha cambiado todo. Ahora la IA analiza un ejemplo de voz de una persona y rebusca en una gran base de datos para encontrar voces similares. Al encontrar patrones, crea una voz digital que se ajusta a ese hablante de forma mucho más adecuada. Algunas empresas necesitan tan solo 50 frases para construir esa recreación de la voz.

Libertad. Otros afectados por ELA que participan en el tema como Brian Wallach hablaban de cómo para él "esta voz es libertad". De momento puede teclear, pero como ocurre con Brady, llegará un momento en el que para escribir necesitará usar sus ojos, lo que hace que la conversación se ralentice más. Y aún así, una cosa es segura: su voz seguirá estando ahí para cuando quiera usarla.

Imagen: Clay Banks

En Xataka | La ELA "enclaustra" a las personas en su cuerpo. Ahora la ciencia está logrando que se comuniquen con el exterior

Comentarios cerrados
Inicio