La inteligencia artificial es como un niño pequeño, su forma de descubrir el mundo está en lo que tiene al alcance y las herramientas que le ofrecen para abrirse al mundo. Google sabe bien que con DeepMind, su plataforma de inteligencia artificial, hay que ir paso a paso, y hoy están adoptando un método de aprendizaje basado en la educación que se usa en niños.
A pesar de que DeepMind ya es toda una potencia jugando y ganado al Go, además de que ya se prepara para su próximo reto en StarCraft II, la plataforma debe empezar por lo básico, que es saber identificar objetos y sus propiedades, para así tomar otro tipo de decisiones basadas en experiencias.
Un juego de niños
Los pequeños tiran, empujan, rompen, y en general experimentan con el mundo físico desde una edad muy temprana, esta es la mejor forma de aprender y Google lo sabe, ya que los encargados de DeepMind junto a investigadores de la Universidad de California, Berkeley, están adoptando este método de aprendizaje ahora adaptado a entornos virtuales.
El objetivo es que DeepMind aprenda sobre las propiedades de objetos físicos para interactuar con ellos, algo que es conocido como 'aprendizaje de refuerzo profundo', el cual permite resolver tareas sin instrucciones específicas, algo muy similar a los animales cuando actúan por instinto, o bien, como los seres humanos cuando se enfrentan a un problema que desconocen.
Los investigadores crearon dos situaciones para que la inteligencia artificial de DeepMind pudiera experimentar y aprender de sus errores. El primer entorno hizo que se enfrentará a cinco bloques del mismo tamaño pero con diferente peso, donde el objetivo era que la plataforma identificara cuál era el más pesado, donde aprendió que la única manera de saberlo era interactuando con todos y cada uno de los bloques.
El segundo experimento consistió en torres de hasta cinco bloques, donde la plataforma tenía que calcular cuántos bloques había en cada una, donde nuevamente aprendió que la clave era interactuar, en este caso separando cada uno de los bloques y contándolos, para así determinar la respuesta correcta. En ambos casos se ofrecían recompensas en caso de aciertos y retroalimentación negativa para los fallos, para que así DeepMind supiera si había acertado o tenía que volver a intentarlo.
Este tipo de experimentos permitirán que la inteligencia artificial descubra nuevas maneras de actuar basadas en el ingenio, con las que será capaz de encontrar soluciones cuando no hay instrucciones claras, o simplemente no las hay, y donde no necesitará conocer las propiedades físicas del objeto o las leyes físicas, lo que sin duda representará un importante avance en el desarrollo de la inteligencia artificial.
Más información | DeepMind En Xataka | La plataforma Google DeepMind ahora puede adquirir conocimientos sin la intervención de los humanos
Ver 9 comentarios