Los robots ya no necesitan 'profesores' humanos: les basta con el realismo de las simulaciones

Los métodos actualmente usados para capacitar a los robots dotados de inteligencia artificial se basan en el uso del aprendizaje por refuerzo: al recurrir a entornos simulados, permiten que las IAs acumulen más experiencia en mucho menos tiempo.

Eso evita que haya técnicos dedicados años enteros a este proceso. Google, por ejemplo, ha conseguido acelerar aún más este paso recurriendo a la ejecución de grupos de robots en paralelo.

El problema es que, una vez terminado el proceso de capacitación, toca poner en marcha los robots físicos en su entorno físico. Y, dado que ninguna simulación virtual es perfecta, hasta ahora se hacía necesaria la presencia de humanos capaces de afinar los parámetros de simulación para que coincidan con la realidad.

Este último pase era necesario para que los robots puedan realizar su labor de forma útil y fiable, pero incluso cuando se tiene clara la razón de un posible fallo, el proceso de reajuste de parámetros es largo y tedioso.

Reajustes automáticos mediante sucesivas simulaciones

Pero ahora un equipo de investigadores del laboratorio de robótica que NVIDIA tiene en Seattle, acaba de presentar ante la comunidad científica un método de capacitación para robots que permite prescindir de este último paso y, con ello, de la presencia humana en el proceso.

Eso no significa, ojo, que hayan conseguido crear simulaciones que replican con absoluta precisión el mundo físico, sino que la pequeña brecha existente entre el mundo físico y el virtual puede cerrarse ya de forma autónoma.

La clave reside en ir creando nuevas simulaciones a medida que se detectan nuevos fallos en el mundo real, de tal modo que permitan afinar los parámetros, e ir recibiendo el feedback de en qué medida se ajustan al mundo real.

Después de unas cuantas iteraciones, el reajuste se va realizando solo, aunque de forma globalmente algo más lenta por la ausencia de intuición humana para detectar el posible origen del problema.

En Xataka

Nada de programar: los robots también aprenden a base de la repetición

Además, la vigilancia humana sigue siendo necesaria para parar la máquina si "se vuelve loca", según explican los investigadores, durante alguno de los sucesivos pasos de reajuste.

Como se ve en el vídeo, los investigadores de NVIDIA han sido capaces de verificar, por ahora, la utilidad de este método para tareas simples como la colocación de pelotas en agujeros y la apertura de cajones.

Vía | IEEE Spectrum

Reajustes automáticos mediante sucesivas simulaciones

Recibe "Xatakaletter", nuestra newsletter semanal

Explora en nuestros medios