Usan machine learning para averiguar cuánto de Shakespeare hay realmente en la obra 'Enrique VIII' de Shakespeare

Usan machine learning para averiguar cuánto de Shakespeare hay realmente en la obra 'Enrique VIII' de Shakespeare
7 comentarios Facebook Twitter Flipboard E-mail

'Enrique VIII' es una de las tantísimas obras de teatro escritas por William Shakespeare, y tiene una historia interesante detrás. Shakespeare era el dramaturgo principal de la compañía de teatro King's Men y cuando murió en 1616 fue sustituido por John Fletcher, otro autor que había colaborado con el dramaturgo británico en otras ocasiones, pero que no se sabía si lo había hecho también en 'Enrique VIII'. En un primer momento la autoría se atribuyó a Shakespeare, pero James Spedding, editor de Sir Francis Bacon, dijo que había evidencias de que ciertas escenas y versos tenían rasgos propios de Shakespeare y otras tantas de Fletcher.

Algunos ejemplos serían que Fletcher usa "ye" en lugar de "you" o "em" en lugar de "them", así que basándose en estos patrones, James Spedding propuso una separación por escenas que, en posteriores estudios, ha sido cuestionada. Ahora Petr Plecháč, un investigador de la Academia Checa de Ciencias de Praga, parece haber dado con la respuesta y lo ha hecho usando un modelo de machine learning. Y ha ido más lejos que la división por escenas, puesto que, afirma, es capaz de "determinar la autoría de fragmentos de texto, sin respetar la división de escenas".

Spedding no se equivocaba demasiado

Analisis
Lo primero fue entrenar al algoritmo usando cuatro obras con estilos similares de cada autor. Como puede comprobarse, el sistema detecta correctamente las obras escritas por Shakespeare (morado) y las escritas por Fletcher (verde).

Para ejecutar el modelo de machine learning, Plecháč ha hecho algo que hemos visto en otras ocasiones: entrenar al modelo usando la bibliografía de los autores, siempre teniendo en cuenta que sean obras con un estilo parecido. En este caso hablamos de Shakespeare y Fletcher, así que las obras elegidas han sido las siguientes:

  • Shakespeare: 'Coriolano', 'Cimbelino', 'Cuento de invierno' y 'La tempestad'.
  • Fletcher: 'Valentiniano', 'Monsieur Thomas', 'El precio de la mujer' y 'Bonduca'.

Una vez el algoritmo había analizado cada obra y "aprendido" el estilo de cada autor (basándose en las 500 frecuencias rítmicas y las 500 palabras más frecuentes) se expuso a la obra 'Enrique VIII' usando un mecanismo de ventana deslizante. Combinando lo aprendido y analizando la obra de teatro, el algoritmo devolvió el resultado que puedes ver bajo estas líneas.

Rolling Attribution Of H8 Based On 500 Most Frequent Rhythmic Types And 500 Most Frequent
Cada línea vertical simboliza la separación por escenas. El color morado muestra lo escrito por Shakespeare y el color verde lo escrito por Fletcher.

Cada una de las líneas verticales se corresponde a una escena. En morado aparecen los fragmentos escritos por Shakespeare y en verde los escritos por Fletcher. De acuerdo al autor, "apoya una vez más la atribución de Spedding en gran medida", aunque su modelo es todavía más preciso, puesto que permite descubrir que la autoría no solo cambia por escenas, sino también al final de la escena anterior, algo que podría servir para dar cierta concordancia a los estilos entre escenas.

El autor pone algunos ejemplos en su artículo: "la escena 3.2 se suele atribuir tanto a Shakespeare como a Fletcher. Los tres conjuntos de modelos apoyan esto. Mientras Spedding y otros autores localizan el cambio a la línea 2081, todos nuestros modelos indican que ocurrió más tarde. Los modelos combinados lo sitúan con precisión en la línea 2200". Otro caso: "las escenas 2.3 y 2.4 están, de acuerdo con todos los conjuntos de modelos, creados por Shakespeare. Los tres conjuntos de modelos indican que el cambio se produjo al final de la escena 2.4", por ello el modelo afirma que "la escena 3.1 (la siguiente) fue escrita por Fletcher".

El modelo del autor coincide en gran medida con el de Spedding, aunque difiere en la autoría de las dos escenas del cuarto acto

En pocas palabras, las principales diferencias con la división propuesta por Spedding y la obtenida por el investigador residen en las dos escenas del cuarto acto. Spedding se las atribuye íntegramente a Fletcher, pero el modelo de Plecháč arroja resultados ambivalentes. Basta con ver la gráfica para comprobar que en las escenas 4.1 y 4.2 ambos autores están a la par, lo que podría indicar una autoría mixta.

Finalmente, Plecháč concluye afirmando que la combinación de modelos basados en versificación y modelos basados en palabras "entrenados en el drama inglés del siglo XVII" dan como resultado "una alta precisión en el reconocimiento de la autoría". Dicho esto, Plecháč opina que 'Enrique VIII' es, "con gran fiabilidad", el resultado de la colaboración entre William Shakespeare y John Fletcher.

Vía | MIT Technology Review

Comentarios cerrados
Inicio