Robots que aprenden por refuerzo positivo: la última herramienta de AWS para la automatización de procesos de sus clientes

Robots que aprenden por refuerzo positivo: la última herramienta de AWS para la automatización de procesos de sus clientes
Sin comentarios

Amazon acaba de lanzar una nueva herramienta de machine learning para reforzar AWS RoboMaker, su plataforma para desarrollar aplicaciones robóticas en la nube. Esta nueva herramienta, denominada Amazon SageMaker Reinforcement Learning, utiliza la técnica de inteligencia artificial del aprendizaje por refuerzo y desde la compañía de Jeff Bezos aseguran que facilitará y acelerará la adopción de comportamientos complejos por parte de los robots.

El aprendizaje por refuerzo es una técnica de la inteligencia artificial que se basa en la teoría del condicionamiento operante de la psicología conductiva, según la cual, cuando los humanos conseguimos resultados satisfactorios al realizar una tarea de una forma determinada, tendemos a repetir esa ejecución, pero si los resultados no nos gustan, es improbable que volvamos a hacerlo de la misma forma.

Esta teoría, aplicada a la robótica, permite que los robots aprendan solos a resolver problemas complejos, ya que reciben estímulos positivos cuando consiguen los resultados deseados y negativos cuando son diferentes a lo establecido por el desarrollador.

De acuerdo con Amazon, gracias a esta herramienta los robots irán aprendiendo comportamientos complejos sin necesidad de ningún entrenamiento de datos etiquetados y podrán tomar decisiones correctas a corto plazo mientras van optimizando su rendimiento a largo plazo.

"Organizar operaciones robóticas para entrenar, simular e implementar aplicaciones de aprendizaje por refuerzo es difícil y requiere mucho tiempo, pero con esta nueva herramienta es más rápido experimentar y crear flujos de trabajo", aseguran desde AWS.

AWS RoboMaker es una plataforma que permite a los desarrolladores crear sus códigos en la nube, probarlos en el simulador de robótica de código abierto Gazebo y finalmente, si los resultados son los esperados, implementarlos directamente en sus robots.

Temas
Inicio