Google se ha propuesto enseñar a una IA a usar webs de reservas de vuelos

Entrar en una web de reserva de vuelos. Buscar con la vista el formulario de búsqueda. Seguir las instrucciones (expresadas en lenguaje natural) Mover el cursor y hacer clic. Repasar las opciones y seleccionar la más barata. Mover el cursor y hacer clic. Reservar. Parece sencillo, sin duda. Pero para una inteligencia artificial puede no serlo tanto.

Podemos intentarlo haciendo que aprenda a partir de ejemplos humanos, pero eso resulta poco escalable: si queremos que sea capaz de realizar su misión en una amplia variedad de webs de reserva de vuelos, la mejor estrategia es apostar por el aprendizaje por refuerzo (como el usado para enseñar a jugar a AlphaZero Go), una técnica que permita a la IA aprender autónomamente, mediante miles o millones de procesos de prueba y error.

En Xataka

AlphaZero, la IA capaz de aprender ella misma a jugar al ajedrez y ganar a todas a las IAs adiestradas por humanos

Pero en un caso como el que se nos plantea aquí, la variedad de elementos a contemplar y el abanico de acciones a realizar crece exponencialmente. Por ello, un equipo de investigadores de Google se planteó el mejor modo de resolver este reto: el resultado lo podemos encontrar en el artículo académico, recientemente publicado, 'Learning to Navigate the Web':

"Aunque los enfoques más recientes mejoran la tasa de éxito en entornos relativamente simples con la ayuda de demostraciones humanas para guiar la exploración, aún fallan en entornos donde el conjunto de posibles instrucciones puede llegar a millones".

"Hemos abordado los problemas mencionados desde una perspectiva diferente, proponiendo enfoques de aprendizaje reforzado guiado que pueden generar una cantidad ilimitada de experiencia para que una IA aprenda".

Un vistazo a…

10 APLICACIONES de GOOGLE que PODRÍAN HABER TRIUNFADO

Redes neuronales para entender la estructura de las webs

Los investigadores capacitaron a una red neuronal para comprender la estructura de las páginas web, lo que le permite navegar por ellas y conocer las opciones que éstas le ofrecen. La clave reside en desarrollar un modelo que permita a la red neuronal dar soluciones a un problema con numerosas variables:

"Como ejemplo, en el entorno de reserva de vuelos, el número de instrucciones / tareas posibles puede aumentar a más de 14 millones, con más de 1700 palabras de vocabulario y aproximadamente 100 elementos web en cada episodio".

Este paper viene a ser la secuela de este otro publicado hace un año por investigadores de la Universidad de Stanford, en el que se venía a probar la capacidad de una computadora para aprender a realizar clics de ratón y pulsaciones de teclado para completar tareas en un sitio web, recurriendo a una red neuronal basada en demostraciones humanas.

En Xataka

Es complicado que las máquinas nos entiendan con lenguaje natural, pero si es en español, aún más

Sin embargo, al carecer de este último recurso, los investigadores de Google han diseñado una propuesta basada en el uso de dos redes neuronales: una, 'INET', analiza la estructura del documento y propone los siguientes pasos que debe dar su compañera, 'Qweb', la responsable de ejecutar las pulsaciones y clics.

Los investigadores intentaron innovar también en otros aspectos frente a intentos previos como el de Stanford, y utilizaron una técnica llamada 'aprendizaje curricular' para fragmentar las tareas en otras más pequeñas y ayudar así a la red neuronal a superar los múltiples pasos de un formulario web.

También recurrieron a la 'codificación superficial' para que la IA comprendiera mejor el contenido de la web: así, el campo del formulario con el listado de aeropuertos no es, a ojos de la red neuronal, una mera lista de nombres, sino que es capaz de percibir su sentido por el contexto en que se encuentra dentro de la estructura de la web.

Según los investtigadores, esta clase de innovaciones impiden que la IA incurra en comportamientos de navegación frustantes como el de hacer clic en el botón de envío del formulario como primer paso para obtener la menor recompensa negativa posible.

Redes neuronales para entender la estructura de las webs

RECIBE "Xatakaletter", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios