Lo vimos primero con GitHub Copilot y después con Stable Diffusion. Lo de entrenar a inteligencias artificiales generativas con datos brutos y sin pagar licencias empieza a ser motivo de demandas por parte de creadores de contenido (y código), y ahora ese mismo problema comienza a aflorar en motores de IA conversacional como ChatGPT.

Qué ha pasado. Jason Conti, consejero general de la división Dow Jones en News Corp, lo dejaba claro: "quien quiera utilizar el trabajo de los periodistas del Wall Street Journal para entrenar a inteligencias artificials debería licenciar de forma adecuada los derechos para hacerlo". O lo que es lo mismo: si ChatGPT o (Bing con ChatGPT, o el hipotético Bard) quieren usar sus contenidos para ser entrenados y pulidos, tendrán primero que licenciarlos.

ChatGPT is trained on a large amount of news data from top sources that fuel its AI. It's unclear whether OpenAI has agreements with all of these publishers. Scraping data without permission would break the publishers' terms of service. pic.twitter.com/RXEjMHWXiI