Robots que escriben noticias en español: cuando las máquinas hacen el trabajo de un periodista

Robots que escriben noticias en español: cuando las máquinas hacen el trabajo de un periodista

34 comentarios Facebook Twitter Flipboard E-mail
Robots que escriben noticias en español: cuando las máquinas hacen el trabajo de un periodista

“El Real Madrid destroza con 3 goles al Atlético de Madrid, que dejó el marcador a 1 el pasado sábado. El Real Madrid comienza la jornada con 42 puntos y en la posición tercera; una buena oportunidad para alcanzar al Atlético de Madrid”.

“El Real Madrid se llevó el derbi en el Wanda Metropolitano en un choque intenso en el que el VAR fue protagonista. Los de Solari fueron superiores a los de Simeone, a los que mantuvieron bien controlados, y aprovecharon sus llegadas al área de Oblak”.

Dos crónicas deportivas. Ambas en el mismo idioma, con idénticos protagonistas y sobre el mismo partido. Pero con una diferencia radical: una de ellas —publicada en AS— está escrita por una periodista especializada; la otra, por un robot, un sistema de generación automática de contenidos en español bautizado como LeoRobotIA. La pregunta del millón es: ¿Cuál es cuál?

Los periodistas ya no están solos al ejercer su oficio en el idioma de Mariano José de Larra, Gabriel García Márquez o Eduardo Galeano. La Inteligencia Artificial (AI) y el machine learning han permitido alumbrar softwares capaces de generar textos informativos en español. Leo, desarrollado por LeoRobotIA y Dail Software —empresa especializada en IA y Procesamiento de Lenguaje Natural (PLN)— es un buen ejemplo. Narrativa, startup española que ha despertado incluso el interés de inversores de Emiratos Árabes Unidos (EAU), otro.

A pesar de su juventud —ninguna pasa de los cinco años—, ambas herramientas han logrado una implantación notable en los medios en castellano. A mediados de julio Narrativa y EFE firmaron un acuerdo por el que la agencia dirigida por Fernando Garea distribuirá y comercializará productos de Narrativa. Como detallaba la propia EFE en su web, el convenio le permite incorporar a su oferta “contenidos generados por inteligencia artificial” relacionados con la información deportiva, financiera, meteorológica, los datos estadísticos o sondeos y resultados electorales.

La Agencia EFE se suma así a la amplia cartera de clientes de Narrativa, entre los que ya figuran algunos de los diarios más seguidos en idioma español, tanto en papel como digitales: Sport, 20 Minutos, El Periódico, El Confidencial, El Español, Heraldo, El Independiente o La Información. También aporta contenidos para webs especializadas y de empresas, como Noon, Intigral, Property Finder, The Social Audience o la app deportiva Matchapp.

Hojas de Excel y resultados deportivos

Tras una rutilante trayectoria que ronda los cuatro años —precisa el CEO de Narrativa, David Llorente— la startup colabora a día de hoy “con más de 25 medios”. “Para cada uno generamos una versión distinta. Producimos noticias en tiempo real y únicas por cliente”, señala. La forma en que Narrativa y Leo obtienen contenidos es similar. En ambos casos recurren a tablas de datos mesurables: estadísticas con resultados deportivos, financieros, loterías, meteorología, balances económicos… que convierten en textos informativos. Al menos de momento, ese requisito deja fuera géneros como el reportaje literario, la crónica política, judicial y de viajes, la cobertura de sucesos o las entrevistas. “La idea es transformar datos estructurados, por ejemplo una hoja de Excel, con columnas y datos identificados, en noticias”, comenta Llorente.

Llorente
David Llorente, CEO y cofundador de Narrativa.

La mecánica es similar en Narrativa, si bien sus responsables inciden en el uso del PLN. “Partiendo de datos estructurados que nos proporciona un proveedor enseñamos a la máquina a escribir de fútbol, smartphones, coches, resultados financieros… y le enseñamos a escribir además como quiere el cliente”, apunta Juan Carlos F. Galindo, CEO y cofundador de la firma LeoRobotIA: “Le meto el libro de estilo de ese cliente o medio de comunicación y la máquina es capaz de escribir como quiere y además con una variabilidad infinita; es decir, cada vez, con los mismos datos, yo puedo elaborar un texto distinto infinitas veces”.

“Una vez que he entrenado a la máquina, que le he definido cómo son los datos, que la he entrenado como quiere el cliente, es automático. La máquina bebe de la fuente de datos directamente, automáticamente el medio de comunicación decide cuándo y cómo publica y en milésimas de segundo el robot es capaz de publicar informaciones de mil, dos mil, tres mil… caracteres, lo que quiera el cliente”, señala Galindo antes de incidir en que —a diferencia de otros sistemas parecidos— Leo no recurre a plantillas estándar que el programa se encarga de rellenar.

Los robots que generan noticias emplean datos estructurados, como resultados de partidos, partes meteorológicos o balances financieros

“La diferencia de nuestro robot es que es el primero que escribe en lengua castellana usando datos estructurados, generando textos en milésimas de segundo y con una variabilidad infinita. Hay otros sistemas que, al igual que se empezó hace cuatro o cinco años en EEUU, lo que hacen es usar una plantilla con huecos que el sistema se encarga de rellenar. Eso existe, pero no tiene ni la riqueza ni la variabilidad lingüística que ofrece nuestro sistema”, resalta el impulsor de Leo.

Detrás de Leo están, además de F. Galindo, José Manuel Nieves, Pilar Bernat, Javier López Tazón, Jesús Cardeñosa y Enrique Pascual. El CEO de la firma, veterano periodista especializado en tecnología, recuerda que en un inicio se planteó —junto al resto de compañeros periodistas que fundaron la empresa— lanzar un medio online centrado en ciencia y tecnología.

“Pensamos en que tuviera tres capas de información. Una capa automatizada, otra para información elaborada por expertos y otra creada por la primera y segunda. Nos pusimos a buscar a alguien que nos ayudara con la primera, la automatización en castellano. Nos costó, pero dimos con él hace como año y medio. Encontramos una spin off de la Universidad Politécnica de Madrid que se llama Dail Software, que es experta en IA, machine learning, PLN en castellano… Y con ellos, de momento, hemos dejado de lado la idea de crear un medio especializado para centrarnos en generar contenidos”, recuerda F. Galindo. Aunque sin concretar nombres, avanza que la firma está “trabajando ya en proyectos de automatización” ligados al ámbito deportivo, la tecnología e incluso empresas que recurren a la IA para “posicionarse con sus clientes y fidelizarlos”.

Una fórmula testada por grandes medios

Los softwares generadores de noticias no son exclusivos del español. Tampoco nuevos. Agencias internacionales como Press Association, Associated Press (AP), Reuters o Bloomberg recurren desde hace tiempo a la IA para producir contenidos basados en datos estructurados y plantean reforzar su apuesta durante los dos próximos años. Reuters y Bloomberg, de hecho, ya generan más de un 30% de sus piezas informativas con este tipo de sistemas. Como recuerda EFE en la nota en la que anunciaba su acuerdo con Narrativa, en Gran Bretaña se ha lanzado incluso Reporters and Data and Robots (RADAR), un proyecto pionero impulsado por Press Association (PA) en colaboración con Urbs Media que permite a medios locales disponer de piezas generadas de forma automática. Desde mediados de 2018 suma más de 180.000 artículos.

Img 20181223 Wa0001
Cuatro de los socios fundadores de Leo: José Manuel Nieves, Pilar Bernat, Juan Carlos F. Galindo (tercero por la izquierda) y Javier López Tazón.

En los últimos años se han subido al carro también medios de alcance. Entre los pioneros destacan el New York Times, Forbes o Los Angeles Times. El diario de LA protagonizó de hecho una sonada polémica en 2017, cuando notificó por error de un seísmo que en realidad se había registrado en 1925. El autor de la noticia fue Quakebot, un sistema conectado a la base de datos del US Geological Survey (USGS) para informar de forma rápida y eficiente de cualquier cambio geológico. El problema en 2017 fue que la USGS actualizó los datos sobre el terremoto anotado en la década de 1920, el bot lo tomó como un reporte nuevo e inmediatamente lanzó la alerta.

Resbalones como el de Quakebot o Tay, el chatbot que Microsoft tuvo que retirar en 2016 porque publicaba comentarios xenófobos y sexistas en Twitter, no ha impedido que el uso de robots vaya en aumento en las redacciones. El Washington Post, por ejemplo, recurre a Heliograf para escribir noticias sobre deportes o ciertas piezas políticas. A principios de año trascendía también que Forbes estaba probando una herramienta llamada Bertie. El propio Google ha invertido alrededor de 700.000 euros a través de su división Digital News Iniciative en el impulso de RADAR.

Más alcance para los medios

Gracias a esa apuesta la tecnología ha experimentado un desarrollo considerable en muy poco tiempo. Galindo recuerda cómo los robots de hace cuatro o cinco años tardaban un minuto en escribir una página. Hoy, apunta el presidente de Leo, su sistema es capaz de generar informaciones de miles de caracteres a una velocidad inimaginable hace un lustro escaso. Más allá de la mejora de la técnica, los sistemas automáticos triunfan por su atractivo para las redacciones: ofrecen rapidez a los medios, que consiguen además un mejor posicionamiento SEO y pueden incluso cubrir ámbitos que antes —recurriendo únicamente a redactores de carne y hueso— no lograban abarcar.

“En el pasado apenas hubiéramos podido contar los partidos más significativos de la semana. Ahora podemos cubrir cualquier encuentro para el que tengamos datos, dando a los equipos y aficionados una cobertura casi instantánea para leer y compartir”, señala Jeremy Gilbert, de The Washington Post, en unas declaraciones recogidas por El País sobre el uso de Heliograf: “Crea nuevos modelos de cobertura local”.

“Nos encontramos en un momento en el que necesitamos contenido online, tenemos que abrir público”, explicaba Xabier Ortuño, director adjunto de Sport, durante una ponencia en la que explicaba la llegada de Narrativa a la redacción del diario. Una de las claves en las que incidía es la hibridación en los medios. En resumen: ¿Cómo es la convivencia entre robots y periodistas de carne y hueso? Al igual que las empresas que desarrollan los bots u otros profesionales con cargos directivos, como Pete Clifton, redactor jefe de PA, Ortuño señala que los robots liberan a los periodistas de las labores más mecánicas y les facilita elaborar piezas con mayor valor.

“Podemos centrarnos en trabajar temas más pensados para el lector que lo que es la crónica pura, que ya está en manos de Narrativa. Podemos enfocarnos en destacar a un jugador que creemos que es interesante para nuestros lectores y destacarlo más que la crónica pura o destinar el tiempo a rellenar la ficha técnica de un partido”, anotaba el director adjunto de Sport.

Robot 2 1
Diarios y agencias de influencia internacional se han lanzado ya al uso de robots.

"¿Cómo será la convivencia con los periodistas? Va a ayudar a que hagan un trabajo de mayor calidad, más humano y de más interés”, coincide Llorente. Gracias a los robots los redactores —reflexiona el CEO de Narrativa— se verán aligerados de labores rutinarias, como escribir piezas con los resultados de la lotería o el parte meteorológico. “Cubrimos noticias que el medio no puede cubrir o para las que necesita una pequeña versión que su periodista pueda editar”, remarca.

Juan Carlos F. Galindo apunta también las ventajas para la investigación periodística de sistemas que son capaces de analizar con rapidez grandes bases de datos que a un reportero de carne y hueso le llevaría años estudiar. “Son capaces de encontrar tendencias, patrones, informaciones… que un equipo a lo mejor tardaría años en encontrar”, anota el impulsor de Leo.

Su otra gran ventaja, en la que coincide con Llorente, Ortuño o Clifton es que deja margen a los periodistas para elaborar piezas más personales: “Todos estos textos son editables. Pueden publicarse tal cual o añadirle valor para que el texto sea diferencial. Ese es el verdadero quiz de la cuestión y la razón por la que las empresas de medios en EEUU están teniendo tanto éxito. Al liberar de tiempo al periodista este puede darle valor y personalizar esa información”. Associated Press asegura de hecho que gracias al uso de robots aproximadamente el 20% de su plantilla ha dejado de elaborar artículos simples para asumir investigaciones de mayor envergadura.

A pesar de las voces que insisten en las virtudes y las múltiples ventajas que tendrán los robots para los reporteros tradicionales y el alcance de mayores audiencias, sobre la mesa sigue el debate de si terminarán eliminando empleo. En febrero Magnet recogía en un artículo varios datos que invitan, cuanto menos, al recelo: en juego podrían estar el 7% de los analistas políticos y un 89% de los escritores técnicos. La Universidad de Oxford y la Sociedad Americana de Editores de Noticias rebajan el porcentaje de trabajadores en riesgo por la automatización al 10%.

Medios e impulsores de la generación automatizada de contenidos informativos defienden su utilidad para los periodistas de carne y hueso; hay estudios sin embargo que concluyen que destruirán empleo tradicional

Hoy por hoy el principal aliado de los reporteros humanos son las limitaciones de los robots. Al trabajar con estadísticas y datos numéricos, los nuevos sistemas aún no acceden a los géneros más elaborados y con mayor presencia de la subjetividad. “La inteligencia artificial, en nuestra versión, no debe generar ni opinión ni emociones. Debe informar. Un periodista que haga una crónica personal va evidentemente a añadirle esa emoción, esa opinión”, reconoce Llorente.

Juan Carlos F. Galindo incide en otro punto clave: la credibilidad de las fuentes, en especial a la hora de manejar herramientas que —empleadas con una intención dudosa— pueden convertirse en grandes propagadoras de fake news. Las campañas de Trump en EEUU o Bolsonaro en Brasil son una buena prueba del alcance que puedan tener las informaciones inventadas bien diseminadas. “Todo se puede hacer para bien o para mal y evidentemente habrá cosas con las que haya que tener cuidado porque hay gente que utiliza herramientas de este tipo para información falsas”.

Por cierto, y por si no lo habías adivinado: de las dos crónicas que encabezan este artículo, la elaborada por un robot es la primera. Las máquinas han llegado al oficio de Larra... Y todo indica que para quedarse.

Imágenes: Flickr (AdNorrel), Flickr (John Davey)

Comentarios cerrados
Inicio