Son muchos los que en el mundo de la inteligencia artificial utilizan con alegría el término "Open" (abierto) y presumen de que sus modelos son Open Source. En los últimos tiempos se ha criticado mucho ese tipo de mensajes, pero lo cierto es que la definición de modelos de IA Open Source no era nada clara hasta el momento. Eso es algo que la OSI quiere cambiar.

Quién es la OSI. La Open Source Initiative (OSI) es una organización sin ánimo de lucro dedicada a la promoción del código abierto. Creada en 1998, es la responsable de la adopción de la llamada Open Source Definition para el software de código abierto. Es por tanto a la hora de saber qué condiciones y requisitos debe cumplir un desarrollo software para ser considerado como Open Source.

Meta en el ojo del huracán. El debate sobre esa definición y el uso teóricamente injustificado del término Open Source se reactivaron especialmente por culpa de Meta. La compañía no paró de hablar de Llama 2 como modelo Open Source, y aunque relajó un poco el discurso con Llama 3, es fácil comprobar que abusan del término. No es la única empresa que lo hace, claro: la mismísima OpenAI, referente en este campo con ChatGPT, usa la palabra "Open" en su propio nombre cuando su modelo y sus políticas están entre las más cerradas del sector.

Ambigüedad y confusión. Aunque Llama 3 está disponible libremente y permite, no se ajusta a la definición tradicional de Open Source porque impone ciertas restricciones a su licencia de uso según el tamaño del proyecto o el tipo de contenido. Flux, un modelo de IA para generación de imágenes que está ganando mucha popularidad, también plantea esa confusión, y aunque tanto esos como otros proyectos suelen aprovechar ese discurso de apertura, la confusión para los usuarios es evidente porque no hay modelos que entren en la definición clásica de Open Source.

Solución a la vista. Como indican en Ars Technica, la OSI ha reunido a un equipo de unos 70 expertos —investigadores, abogados, activistas, o reguladores— para crear una definición de modelos de IA Open Source. Hay incluso representantes de Meta, Google o Amazon, y ya tienen un borrador (versión 0.0.9) disponible de esa definición.

Qué es una IA Open Source. Aunque el proceso no se ha completado, el borrador incide en "cuatro libertades fundamentales" que se inspiran en las del software Open Source. Así, se debería dar a los usuarios de esos modelos Open Source de IA libertad para usar esos modelos con cualquier propósito sin permiso, estudiar su funcionamiento, modificarlos para cualquier propósito y compartirlos con o sin modificaciones.

Más allá de los "pesos abiertos". A menudo los modelos que presumen de ser Open Source comparten los "pesos", que proporcionan información sobre cómo se realizan sus cálculos. En la OSI indican que el borrador incluye no solo el modelo de IA o sus pesos, sino todo el sistema y sus componentes. Eso haría necesario ser totalmente transparentes con los datos con los que se ha entrenado el modelo —ninguno de los grandes lo hace—, el código fuente utilizado para entrenar y ejecutar el modelo, y los pesos y parámetros usados en el modelo.

No los datos, pero sí los metadatos. En esa búsqueda de la transparencia, la OSI aclara en su borrador que no es necesario publicar los datos de entrenamiento "en crudo". En realidad lo que se busca es tener los metadatos de ese conjunto de datos de entrenamiento y de los métodos de entrenamiento: fuentes de los datos, criterios de selección, técnicas de preprocesado y cualquier otro detalle que permita a otras personas o grupos recrear sistemas de forma similar. Eso es importante, porque la definición no obliga a que los datos de entrenamiento como tales no se publiquen.

Definición definitiva en octubre. Se espera que esa definición definitiva de una "IA Open Source" esté completa el próximo mes de octubre, cuando se celebra la conferencia All Things Open 2024. La OSI aun así sigue animando a cualquiera a que aporte su granito de arena a la hora de perfilar esa definición definitiva, y ha creado un foro de discusión pública donde debatir sobre el tema.

¿Qué impacto tendrá la definición? La aparición de una definición formal y aceptada de "IA Open Source" puede ser especialmente importante para el desarrollo de futuros modelos por parte tanto de empresas como de personas o grupos que trabajan de forma independiente: cumplir con los requisitos de esa definición permitirá garantizar esos requisitos, lo que sin duda impulsará los modelos Open Source como ya ha ocurrido durante cuatro décadas en el caso del software de código abierto.

