Hoy vamos a hablarte sobre qué son los Captcha y reCaptcha y qué diferencias hay entre ambos. Google ha presentado la tercera versión de su tecnología reCaptcha que limitará aún más la necesidad de interactuar con las webs para demostrar que somos humanos, un momento propicio para establecer la diferencia entre ambos términos.

En líneas generales, podemos decir que el reCaptcha es una evolución del Captcha, que fue el test original con el que empezó a intentar diferenciar usuario humano de spambot a principios de la primera década del año 2000. Vamos a empezar diciéndote qué es el Captcha, para seguir explicando qué es el reCaptcha, cómo se diferencian, y qué novedades aporta el nuevo reCaptcha v3.

Qué es un Captcha

La palabra Captcha o CAPTCHA es una abreviatura que viene de las siglas de "Completely Automated Public Turing test to tell Computers and Humans Apart", que literalmente significa Test Público Completamente Automatizado de Turing para Diferenciar a los Seres Humanos de las Computadoras. Por lo tanto, viene a ser un Test de Turing inverso, en el que son los humanos los que tienen que demostrar con esta tecnología que son humanos y no máquinas.

¿Y para qué tenemos que diferenciar a los seres humanos de las máquinas en Internet? Pues para evitar que los bots o automatismos interactúen con las páginas web, y asegurarse de que detrás de determinadas acciones hay siempre usuarios humanos.

En la década de 1990, en el ámbito de Internet había un gran caos por culpa del spam creado por una gran cantidad de spambots que inundaban los buzones de entrada del correo electrónico y los foros online. Pero en el año 2.000, un joven de 22 años llamado Luis von Ahn diseñó un sistema para controlar toda esa publicidad automática: obligar a que los que se registren en foros y correos tengan que demostrar que eran humanos y no programas informáticos.

Y es así como nació el Captcha, una prueba en la que había que reconocer letras garabateadas y difíciles de leer durante en sólo unos segundos durante el proceso de registro, algo fácil para humanos pero difícil para bots. Pero este sistema tenía un problema, y era que exigía a los usuarios bastante esfuerzo a cambio de nada, simplemente para demostrar su humanidad. Por lo tanto, con el fin de hacer el sistema útil hubo que hacerlo evolucionar, y nació el reCaptcha.

Qué es el reCaptcha

El reCaptcha es una evolución del código Captcha que busca ser más constructivo y sacar provecho de todos lo códigos que introducen los usuarios. En su primera generación, dejaron de mostrar letras aleatorias para mostrar palabras procedentes de proyectos de escaneo de textos. De esta manera, mientras verificábamos que éramos humanos empezamos a ayudar a digitalizar textos con palabras que los ordenadores no terminaban de poder entender.

Este proyecto para verificar que los usuarios eran humanos siempre ha sido totalmente gratuito, y Google lo compró en 2009, movimiento con el que empezó a utilizar reCaptcha para ayudar a digitalizar sus libros de Google Books. Sin embargo, la empresa del buscador también lo hizo evolucionar.

En diciembre del 2014 la tecnología reCaptcha evolucionó con No CAPTCHA reCAPTCHA, que permitía verificar que eres un humano pulsando sólo un botón. Para prescindir de los códigos, Google empezó a utilizar algoritmos internos y a examinar pistas no escritas de cada usuario, como la dirección IP o las cookies activas. Con estos dos parámetros, el algoritmo de Google comprueba el comportamiento del usuario a través de Internet, asegurándose de que navegamos como humanos.

También registra el movimiento del ratón hasta hacer click en el botón de identificación, y también utiliza otros parámetros que ha decidido mantener deliberadamente ocultos para que las empresas que diseñan los bots no sepan cómo superar esta línea de seguridad. Aun así, si el reCaptcha no está seguro de que eres humano te seguirá mostrando pruebas, ahora con imágenes con las que se alimenta su algoritmo de reconocimiento.

Captchas vs reCaptchas

Coloquialmente, tanto a los Captcha como reCaptcha se les suele llamar simplemente Captcha, básicamente porque fue el primer término que se acuñó para esta tecnología. Existen todavía varios tipos de Captcha, eso es verdad, pero el más extendido ahora mismo es el reCaptcha, que es una evolución del primer Captcha.

Por lo tanto, cuando oigas hablar del Captcha ten en cuenta que en la conversación se estará incluyendo tanto el reCaptcha como otras posibles alternativas que puedan estar desarrollándose por otras empresas. Mientras, cuando concretamos diciendo reCaptcha es para referirnos exclusivamente a la tecnología que utiliza Google, aunque pueda haber otras similares.

Esta es una tecnología que, por definición, tiene que ir evolucionando de forma periódica. Con el tiempo, investigadores y empresas de spam van descubriendo cómo funcionan los algoritmos internos con los que se identifican a los bots, e incluso utilizan la inteligencia artificial para saltárselos, por lo que los responsables de los Captchas y reCaptchas tienen que mejorarlos continuamente intentando no repercutir en la dificultad de cara al usuario real.

Y es este en el contexto en el que Google presentó primero la segunda versión del reCaptcha en 2014, y una tercera en 2018. La idea es que los usuarios lo tengamos cada vez más sencillos y el sistema para identificarnos sea casi automático, todo mientras se siguen manteniendo a raya unos bots y automatismos cada vez más complejos.

Qué cambia con el nuevo reCaptcha v3

A finales de octubre del 2018 Google ha presentado la tercera generación de reCaptcha v3. Su objetivo es que los usuarios humanos no necesiten realizar ninguna acción para verificar que no son bots, ni realizando pruebas interactivas ni siquiera marcando una casilla para verificar sus cookies y movimientos por la red.

A cambio, este nuevo sistema le asignará a cada usuario una puntuación diferente, clasificándolos del 0.0 al 1.0 en orden de más posible a menos posible de que sea un bot. La puntuación se basará en diferentes tipos de interacciones que realicen los usuarios, que van desde el movimiento del ratón al tiempo que pasan en cada sección de la web o los clicks que se realizan.

Esto quiere decir, que el reCaptcha identificará a cada usuario basándose en los movimientos que hacen en cada web. Además, esta tercera generación también promete un mayor control para los administradores de las páginas, que podrán ver las puntuaciones de sus visitantes para saber hasta qué punto reciben tráfico real, y podrán requerir autenticación en dos pasos o verificación por correo electrónico para los usuarios con menos puntuación.

Por defecto, reCaptcha v3 usará un umbral de 0.5 puntos, y los visitantes con una puntuación inferior necesitará demostrar que es humano como pasa ahora cuando el automatismo falla. Sin embargo, los usuarios de cada web podrán modificar este umbral, y se les permitirá entrenar el modelo de su web para combatir los bots que busquen saltarse la seguridad.

