Aprender a escribir a un proceso que no sólo consiste en copiar caracteres, sino también aprender cómo se traza cada uno de esos caracteres, el espacio que hay entre ellos ya sea para formar palabras o frases y por supuesto su significado. Durante siglos, esta tarea ha sido algo exclusivo de los seres humanos, pero ahora los robots, con la ayuda de la inteligencia artificial, podrían estar cerca de igualarnos.
A día de hoy, los robots son capaces de imitar o duplicar lo que dibujamos o escribimos, pero esto lo hace "en bruto", es decir, reconoce la imagen como un todo y la reproduce línea por línea, como una impresora. Ahora, gracias a un proyecto de la Universidad de Brown en Rhode Island, Estados Unidos, podemos ver cómo un robot es capaz de escribir y trazar como un ser humano, incluso en idiomas que no conoce y jamás había visto.
¿Puede un robot imitar un trazo con sólo mirar el resultado?
Atsunobu Kotani, estudiante de la Universidad de Brown, desarrolló un algoritmo de machine learning que hace uso de redes neuronales cuyo trabajo consiste en analizar imágenes de palabras escritas a mano o bocetos, esto con el objetivo de deducir la sucesión de trazos que los originaron.
Stefanie Tellex, especialista en robótica de la Universidad de Brown, fue quien desarrolló el sistema robótico al que se le añadió el algoritmo para que trabajase por sí mismo. El objetivo de esto era poder crear un robot capaz de comunicarse de forma fluida con los seres humanos.
Una vez teniendo el robot y el algoritmo, éste se entrenó usando un conjunto de caracteres japoneses. Después de esto, el robot demostró que era capaz de reproducir dichos caracteres usando los trazos que los crearon con aproximadamente el 93% de precisión. Pero esto no fue lo sorprendente, la sorpresa fue cuando el robot pudo hacer lo mismo con caracteres latinos, incluso en manuscrita y cursiva. Es decir, caracteres que nunca había visto y no conocía.
El algoritmo
La clave de esta hazaña está en el algoritmo desarrollado por Kotani, el cual ayuda al robot a decidir dónde y cómo colocar cada trazo y su duración, que sirve para distingue cada letra del alfabeto, así como el orden en que debe colocarse cada letra o símbolo para crear la palabra correcta.
El robot se basa en dos modelos de algoritmo que le ayudan a escribir por sí mismo:
Modelo Global: éste permite al robot mirar la imagen como un todo, lo que le ayuda a decidir cuál es el más probable punto de partida para la palabra o letra en particular, así como la forma más probable de pasar al siguiente símbolo o letra.
Modelo Local: éste ayuda al robot a analizar cada letra de forma especifica, es decir, cómo realizar el movimiento y dirección correcta hasta cómo finalizar la linea de ese carácter, así como su colocación, tamaño y distancia.
Stefanie Tellex señaló que el robot no siempre realiza los trazos exactos y correctos al escribir las letras, pero "se acerca bastante". Lo realmente importante de esto, destaca, es cómo el algoritmo es capaz de generalizar su capacidad de reproducir trazos.
"Mucho del trabajo existente a día de hoy en esta área requiere que el robot tenga información sobre el orden de los trazos por adelantado. Si quieres que el robot escriba algo, alguien tiene que programar el orden de los trazos. Con lo que ha hecho Atsu, puedes dibujar lo que quieras y el robot puede reproducirlo. No siempre imita cada trazo de forma perfecta, pero se acerca bastante".
Escribiendo "hola" en 10 idiomas distintos
Una vez que el robot demostró su capacidad, lo siguiente fue ponerlo a prueba en otras situaciones con el fin de confundirlo. Es así como pidieron a 10 personas del laboratorio 'Humans to Robots', donde trabaja Tellex, que escribieron 'hola' en sus idiomas nativos y usando su propia letra.
Con esto, lograron tener 'hola' escrito en griego, hindú, urdu, chino, yiddish y otros idiomas, y el robot fue capaz de reproducirlos todos con una precisión sobresaliente, lo que hizo difícil que otras personas pudieran determinar cuál fue el trazo hecho por el robot y cuál fue el del humano, según explican.
Lo siguiente fue pedirle a un grupo de niños de 6 años que también escribieran 'hola', cada uno con una letra "accidentada" que en ocasiones fue difícil de entender. Según los responsables del robot, éste fue capaz de copiar la escritura a mano de los niños con aparente facilidad.
La prueba final: un boceto de la Mona Lisa
La prueba definitiva que demostró las capacidades de este robot, que por cierto aún no cuenta con nombre, fue cuando Tellex dibujo un pequeño boceto de la Mona Lisa, usando trazos básicos y personales, para luego dejar que el robot lo mirara e imitará.
Según Tellex, el robot copió el boceto con bastante fidelidad. Kotani lo relató de la siguiente manera:
"Cuando regresé al laboratorio, todos estaban de pie alrededor de la pizarra, mirando a la Mona Lisa y preguntándome si [el robot] había dibujado eso. No podían creerlo."
Para el equipo de desarrollo, ese fue el momento clave en la que el robot demostró que estaba más allá de la mera impresión, ya que el robot fue capaz de crear una imagen con trazos parecidos a los de un ser humano.
Tellex asegura que la imagen de la Mona Lisa se hizo en agosto y a día de hoy la mantienen en la pizarra como una muestra de las capacidades del robot.
"Lo que hace que este trabajo sea único es la capacidad del robot para aprender desde cero."
El equipo responsable del robot espera que las ideas recogidas a través de su investigación puedan ser utilizadas para construir robots capaces de dejar notas, o hacer dictados y bocetos, todo con el objetivo de poderse comunicar con los humanos o bien, que puedan servir como nuevas herramientas de comunicación. Bien podría ser un paso hacia una nueva forma de comunicación entre humanos y máquinas.
Ver 2 comentarios