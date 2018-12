La presentación de Google Duplex y de sus posibilidades como chatbot conversacional nos sorprendieron a muchos hace unos meses, pero esa tecnología no es ni mucho menos exclusiva de Google: el gigante chino Alibaba tiene un desarrollo que rivaliza con la propuesta de Google, y lo hace con elementos realmente prometedores.

Dicho chatbot se llama AliMe y ha sido desarrollado por el Machine Intelligence and Technology Lab de Alibaba. El sistema ya se está usando en su división de logística, Cainiao, y en las conversaciones de demostración el chatbot es capaz de mantener el tipo incluso cuando el interlocutor humano le interrumpe o cambia el hilo de la conversación.

A este robot no le importa que le interrumpas

En la demostración que Alibaba ofreció el pasado 2 de dicembre en la converencia 2018 Neural Information Processing Systems (Neurips) la empresa presumió de cómo este asistente ya se utilizaba en millones de llamadas al día con peticiones de los clientes en un escenario muy específico: localizar sus paquetes y saber qué momento era el mejor para entregarlos.

Una conversación de prueba —que ciertamente era una versión óptima de su funcionamiento— mostraba cómo este chatbot era capaz de gestionar tres tipos de elementos conversacionales que hasta ahora eran difícilmente implementables en un desarrollo de este tipo. El ejemplo era el siguiente (traducido del chino mandarín, el idioma que maneja habitualmente el asistente, aunque también soporte el inglés):

Agente : Hola, soy el asistente de voz de Cainiao. Soy-

: Hola, soy el asistente de voz de Cainiao. Soy- Cliente : Hola.

: Hola. A : Sí, hola, usted tiene un paquete programado para la entrega de la mañana a 588 Culture West Road. ¿Es una hora adecuada para que lo reciba usted?

: Sí, hola, usted tiene un paquete programado para la entrega de la mañana a 588 Culture West Road. ¿Es una hora adecuada para que lo reciba usted? C : ¿Quién llama?

: ¿Quién llama? A : Soy el asistente de voz de Cainiao. Me gustaría confirmar su entrega matutina en el 588 de Culture West Road. ¿Le parece bien?

: Soy el asistente de voz de Cainiao. Me gustaría confirmar su entrega matutina en el 588 de Culture West Road. ¿Le parece bien? C : No estoy en casa por la mañana.

: No estoy en casa por la mañana. A: ¿Entonces tiene otra dirección que le gustaría usar?

En esa conversación, explican en el MIT, se dan esas tres situaciones tradicionalmente complejas para estos chatbots. El cliente humano que es llamado primero interrumpe al asistente, que aún así responde sin problemas. Luego se da una conversación no lineal cuando el cliente de repente cambia de tema y le pregunta quién es al asistente. Por último hay una comprensión implícita de la frase "No estoy en casa por la mañana", que no es del todo clara pero que aún así el asistente entiende por el contexto y a la que responde con una pregunta que le presenta una opción al cliente.

El sistema de Alibaba lleva tiempo en desarrollo y de hecho la firma tiene artículos técnicos como este o este en los que describe con más detalle el funcionamiento de esta tecnología.

En este sistema interviene la comprensión del lenguaje natural (NLU), además de una combinación de las dos técnicas en las que normalmente se basan los asistentes: la recolección de información (IR) y los modelos de generación pre-entrenados con los llamados modelos secuencia-a-secuencia (seq2seq). En Alibaba aseguran que su solución híbrida permite encontrar diversas respuestas a una interacción del cliente para luego clasificarlas y seleccionar la mejor. El resultado, al menos en esa demostración, es realmente convincente.

AliMe se utiliza de momento en Cainiao, pero en Alibaba aseguran que se puede aplicar a otros muchos escenarios. Aquí hay otro factor fundamental para el buen funcionamiento del sistema, y es esa gigantesca base de datos que alimentan con las grabaciones de los clientes y que sirven para entrenar estos modelos y hacerlos cada vez más precisos a la hora de seguir la conversación y contestar de forma adecuada cada petición.

Vía | MIT Technology Review