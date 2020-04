Utilizar una inteligencia artificial para replicar la voz y hacer ver que decimos cosas que no hemos dicho. Son los deepfakes de audio y los podemos encontrar en canales de YouTube como Vocal Synthesis. En ese canal, con casi 40.000 suscriptores, podemos escuchar a Frank Sinatra cantando 'Dancing Queen', a Barack Obama leyendo a H.P Lovecraft o a Jay-Z rapeando el 'To Be, Or Not To Be' de Hamlet.

No parece que le haya gustado a este último encontrar que su voz está siendo replicada con una IA pues a través de Roc Nation, su agencia de derechos, ha presentado una demanda al canal de YouTube y ha solicitado su eliminación por "derechos de autor".

El primer vídeo conocido de deepfakes de audio eliminado de Youtube

Youtube está plagado de deepfakes de audio. Es sencillo encontrar voces creadas artificialmente que se encuentran cantando o leyendo un texto que no es suyo. Pero esta es la primera vez donde se tiene constancia que un artista ha demandado directamente a un canal por este uso supuestamente indebido de la inteligencia artificial.

La decisión surge a raíz de un artículo publicado por Andy Baio, cofundador del festival XOXO, en su blog Waxy, donde describe el trabajo del canal Vocal Synthesis y su uso de la IA para hacer ver que Jay-Z leía a clásicos como Shakespeare.

As far as I know, this is the first time a musician's filed a copyright claim for deepfaked vocals, and the first time YouTube has removed a video for AI voice impersonation. — Andy Baio (@waxpancake) April 28, 2020

El texto llamó la atención de Roc Nation y decidieron presentar una demanda a Youtube por "infracción de copyright". "Este contenido usa ilegalmente una IA para hacerse pasar por la voz de nuestro cliente", explica el responsable del canal a TheVerge. "Parece razonable suponer que un modelo y audio generado a partir de grabaciones de audio con derechos de autor se considerarían trabajos derivados. ¿Pero es una infracción de derechos de autor? Como prácticamente todo en el mundo de los derechos de autor, depende de cómo se usó y con qué propósito", argumenta Voice Synthesis.

Para la generación de estos deepfakes de audio, Voice Synthesis utiliza precisamente un software de Google, el motor open source Tacotron 2. A través de la IA es posible elegir una canción de Jay-Z, "obtener su voz" y hacer que lea un texto que se le introduce de manera escrita.

Youtube ha reestablecido el vídeo, pero el debate sobre el uso de los deepfakes de audio continúa

A raíz de la denuncia de Roc Nation, Youtube eliminó el vídeo de Jay-Z leyendo a Shakespeare. Una decisión que en poco tiempo han rectificado, pues ahora de nuevo vuelve a estar disponible el vídeo.

El debate está encima de la mesa, pues no está claro qué supone una infracción de derechos en los casos de deepfake de audio. Entre los argumentos que pueden suponer una infracción está el propósito del vídeo, la naturaleza del vídeo y los efectos y alcance que logra. En el caso de Voice Synthesis estamos ante un canal pequeño, creado específicamente para mostrar el alcance de los deepfakes de audio y además no está monetizado.

En respuesta a Andy Baio, el autor de Voice Synthesis, que desea mantener el anonimato, explica que no tiene claro si ha sido Youtube quien ha revertido la decisión o ha sido la propia Roc Nation quien ha retirado la demanda.

Desde Xataka hemos contactado con Youtube para conocer más detalles sobre este vídeo y su política respecto a los deepfakes de audio.