Los CAPTCHAs se han vuelto demasiado complejos... para nosotros, que no para las máquinas

Los CAPTCHAs se han vuelto demasiado complejos... para nosotros, que no para las máquinas
Sin comentarios Facebook Twitter Flipboard E-mail

Seguro que alguna vez has tenido que enfrentarte a un CAPTCHA, esas pequeñas pruebas que algunas páginas web no exigen superar para acceder a determinados contenidos.

Fundamental y paradójicamente, consiste en un test de Turing inverso: una máquina intenta determinar si verdaderamente eres un humano.

16 años jugando al gato y al ratón con los spambots

Este sistema para evitar el tráfico bot fue creado en 1997 por ingenieros de Altavista, aunque no se lo pondría este nombre hasta 6 años más tarde, y ofrecía poco más que fragmentos de fotografías mostrando alguna clase de texto que teníamos que transcribir. Una tarea fácil.

Una década más tarde, el sistema estaba en manos de Google y la compañía descubría que una computadora podía presentar un rendimiento mucho mejor que muchos humanos (99,8% vs 33%).

Y eso, pese a que los textos de los CAPTCHAs cada vez estaban más distorsionados (casi hasta lo indescifrable). Pero sus desarrolladores eran conscientes de que ésta es una carrera en la que la IA siempre nos va a alcanzar, y que lo que mejor funciona es cambiar cada cierto tiempo de enfoque.

Eso fue lo que hizo Google cuando adoptó la tecnología No Captcha ReCaptcha, que ahora pasaba a decidir tu naturaleza en base a un análisis de las acciones previas del usuario en la página web. Pero esos eran los buenos viejos tiempos: ahora, de nuevo, superar un CAPTCHA se ha convertido en una tarea tan tediosa como merecedora de convalidar alguna titulación.

Yo, personalmente, estoy ya un poco harto de seleccionar fotos (poco claras) de autobuses, escaparates, semáforos, pasos de cebra y bocas de riego; y estoy deseando que Google vuelva a dejar atrás a los spambots apostando por alguna nueva tecnología.

Sin alternativas a medio plazo

El problema es que, como explica a The Verge Jason Polakis, profesor de computación en Chicago, "necesitamos alguna alternativa, pero aún no hay un plan concreto".

Y mientras tanto, la trampa en la que deberían caer las IAs no está logrando más que dificultar la navegación de usuarios humanos. Se han ido probando y debatiendo alternativas basadas en rimas infantiles, en el trivial o en la clasificación de rostros por expresión facial, género y origen étnico; todo ello sin demasiado éxito.

También se ha puesto recientemente sobre la mesa la opción de crear CAPTCHAs similares a juegos de puzzles, consistentes en rotar formas geométricas o mover piezas por un tablero.

El primer problema es que cuando hacemos estas pruebas lo bastante complejas como para convertirse en un reto para la IA, empiezan a aparecer grupos de usuarios que sienten que también son demasiado complejas para ellos. Y no es porque seamos poco listos, sino porque estas alternativas al CAPTCHA se basan en elementos culturales, lingüísticos o vinculados a la experiencia. Elementos que no todos los humanos compartimos.

El segundo problema es que aquellas capacidades que sí compartimos sin duda alguna (y que no requieren de entrenamiento previo) son precisamente en las que destacan los bots (como el procesamiento de imágenes).

via GIPHY

Como explica Polakis:

"Necesitamos algún tipo de desafío que [esté] al margen de las complejidades y diferencias culturales. Algo que sea fácil para un humano promedio, desvinculado de cualquier subgrupo específico de personas y que al mismo tiempo sea difícil para las máquinas. Eso limita mucho aquello que realmente puedes hacer".

Así las cosas, parece que sólo cabe la opción de retomar algo más cercano al enfoque original de reCAPTCHA y apostar por la búsqueda de indicios de automatización en el comportamiento del usuario (por ejemplo, que interactúe con una web sin mover el ratón, o moviéndolo siempre igual). Teóricamente, ésa es la intención de la tercera generación de reCAPTCHA, cuya API fue presentada a finales del año pasado.

Aaron Malenfant, el jefe de ingeniería del equipo CAPTCHA de Google, afirma que el ritmo de evolución de las técnicas de machine learning provocarán que, dentro de 5-10 años, los desafíos de CAPTCHA dejen de ser viables. Confía, no obstante, en que para entonces la WWW cuente con tests de Turing "ejecutándose constantemente en segundo plano".

Vía | The Verge

Inicio