Así es posible saber si un vídeo es un deepfake con sólo un abrir y cerrar de ojos, literalmente

Así es posible saber si un vídeo es un deepfake con sólo un abrir y cerrar de ojos, literalmente
13 comentarios Facebook Twitter Flipboard E-mail

La primera vez que oímos hablar de los deepfakes fue en un contexto relacionado con una de las grandes motivaciones del ser humano: el sexo. El resultado resultaba entonces impresionante, sí, pero lo cierto es que la fantasía no duraba más allá de dos vistazos, pues los errores en la superposición de los rasgos faciales todavía resultaban evidentes.

Ayer saltó a la fama en las redes sociales otro deepfake, el que fusionaba el rostro de Steve Buscemi con el cuerpo y la voz de Jennifer Lawrence. La motivación en este caso es la sátira, y el resultado es más que convincente. Escalofriantemente convincente, de hecho... aunque, un ojo entrenado puede todavía detectar efectos sospechosos en el rostro de 'Jennifer Buscemi' cuando mira hacia los lados, por ejemplo.

Pero es innegable que el salto dado por esta tecnología de manipulación de imágenes en poco más de un año es más que notable. Y que en el futuro seguirá mejorando, haciendo virtualmente imposible diferenciar un vídeo real de un deepfake.

Será entonces cuando esta clase de vídeos puedan sumar al sexo y la sátira la tercera gran motivación humana, la política, y convertirse, como ya dijimos en su día, en un potencial peligro para la democracia, al facilitar la difusión de bulos mucho más creíbles.

Mírale fijamente a los ojos...

Sin embargo, todavía hay un elemento, un pequeño error, de los deepfakes que permite detectarlos (aunque para ello pueda hacer falta recurrir a un software): los parpadeos. En circunstancias normales, humano adulto tiende a parpadear una vez cada 2-10 segundos, y cada uno de sus parpadeos se prolonga durante 1-4 décimas de segundo.

Cualquier persona que no fuerce a propósito su ritmo de parpadeo deberá encajar dentro de esos rangos en cualquier aparición en vídeo. Pero, y aquí está la clave, la mayoría de los vídeos fake no se ajustan al mismo: los rostros manipulados parpadean muchísimo menos.

Aquí un ejemplo:

La razón de esto es bien simple: incluso aquellas personas que viven rodeadas de fotógrafos no suelen ver publicadas aquellas fotografías en las que aparecen con los ojos cerrados. Y, dado que son esas fotos que pululan por Internet las que los creadores de deepfakes usan para 'alimentar' las redes neuronales que generan los vídeos manipulados, no hay modo de que el ritmo de parpadeo resultante pueda pasar por una imagen real.

Siwei Lyu, director del Laboratorio de Visión Artificial y Aprendizaje Automático de la Universidad de Albany (EE.UU) ha recurrido también a la IA para analizar automáticamente vídeos, detectar el número de fotogramas en que las personas aparecen con los ojos cerrados y dictaminar a partir de ese dato si se trata o no de un deepfake. Su tasa de detección es "de más del 95%".

I Want To Believe

¿Estamos salvados, entonces, de la amenaza que los deepfakes representan para la reputación de las personas (famosas o no)? No. Ni por asomo.

En primer lugar, porque ninguna solución tecnológica puede prolongarse mucho en el tiempo (recordemos el caso de la IA que ha aprendido a resolver CAPTCHAs). El propio Lyu advierte que

"la tecnología mejora rápidamente, y la competencia a la hora de generar/detectar vídeos falsos es análoga a un juego de ajedrez. De hecho, se puede agregar un parpadeo a los vídeos deepfake incluyendo imágenes de caras con los ojos cerrados o usando secuencias de vídeo como entrenamiento.

Las personas que quieren confundir al público mejorarán el modo en que crean deepfakes, y los miembros de la comunidad tecnológica tendremos que seguir buscando formas de detectarlos".

En segundo lugar, porque ninguna solución tecnológica bastará cuando la persona quiere creer. Ya es fácil percibirlo hoy en día: incluso los fakes tradicionales más groseramente obvios o más fácilmente comprobables pueden cosechar miles de impactos siempre que cumplan con una condición fundamental: que refuercen los prejuicios del usuario.

Si, además, nos los presentan en un formato a priori tan creíble como un vídeo deepfake, ningún software de detección de parpadeos o sistema equivalente podrá salvarnos de la difusión masiva de información falsa.

Vía | The Conversation

Comentarios cerrados
Inicio