El escándalo literario del año lo protagoniza un texto que nadie sabe si es IA: es la punta del iceberg de un problema sin control

El pasado 18 de mayo, varios usuarios de X hicieron públicas sus sospechas acerca del último ganador del premio Commonwealth de narraciones breves: el relato ganador de la categoría Caribe, publicado en 'Granta' (prestigiosísima revista británica que desde hace décadas es el termómetro del canon literario anglófono), apestaba a ChatGPT. La foto del autor, de hecho, tampoco parecía real. Y cuando la revista respondió al escándalo, lo hizo de una forma que terminó de embarullarlo todo: le preguntaron a Claude si el texto era de IA, y Claude dijo que no.

Cómo se detecta. Reconocer la prosa de un modelo de lenguaje no es tan sencillo como parece, pero tampoco tan difícil una vez que el ojo lleva cierto tiempo entrenado. Los modelos de lenguaje no escriben buscando la palabra justa: generan el token estadísticamente más probable, teniendo en cuenta el contexto, y es un proceso que se puede identificar. Por ejemplo, la famosa estructura "no es X, es Y", usada como Piedra de Rosetta de la identificación de IAs de texto. Pero hay más: acumulación de metáforas sin referentes claros, verbos como "profundizar en"... los anotadores contratados para ajustar los modelos mediante RLHF (aprendizaje por refuerzo con retroalimentación humana) premian ese tipo de claridad burocrática, que lo hace también todo más obvio.

Qué tiene el relato. En el relato de 'Granta' se dicen cosas como "el mediodía que zumba" o el "aire dulce con olor a caña y a olvido". Algunos autores, como Benjamin Breen en este excelente análisis han detallado muchos de esos giros hablan de una atracción especial por los sonidos ambientales y los estados emocionales vagos (nostalgia, tristeza, olvido), que parecen querer rozar una materialidad que el modelo no tiene y, desde luego, no comprende. La acumulación de estímulos sensoriales es una instrucción de manual de escritura creativa que los modelos aplican de forma mecánica y sin discriminación. Es fácil verlo una vez que has aprendido a identificarlo.

En Xataka

La industria literaria ya está dando premios a libros escritos con IA. Y los detectores no están sirviendo para nada

Por qué los detectores no sirven (aún). El problema está en que reconocer esa escritura intuitivamente es una cosa, y demostrarlo de forma objetiva es otra. La primera generación de detectores automáticos (GPTZero, Originality.ai, Turnitin AI) acumulan un largo historial de errores. OpenAI, por ejemplo, retiró su AI Text Classifier en julio de 2023 tras reconocer que solo identificaba correctamente el 26% del texto generado por IA y marcaba como artificial casi el 9% de los textos humanos.

La única excepción a esta tendencia documentada hasta ahora es Pangram. Su técnica, llamada mirror data, entrena al clasificador con parejas de textos estilísticamente idénticos pero con distinto origen. El resultado, según el primer benchmark independiente en septiembre de 2025 es de falsos positivos cercanos a cero y falsos negativos de entre el 2% y el 4% en pasajes medianos y largos; los competidores están puntuando en torno al 10-40%. Sin embargo, de nuevo, no es tan fácil confiar en una herramienta que vende un "humanizador" junto a sus informes de textos sobre la presencia de IA, a veces con porcentajes escandalosamente altos.

La parte educativa. En el mundo del libro estamos ante un escándalo puntual, el de 'Granta', pero en las universidades estadounidenses estamos viendo una escalada permanente de las hostilidades. En este extenso reportaje, por ejemplo, se nos presenta a diez estudiantes y profesores atrapados en una espiral sin salida: los profesores pasan los trabajos por detectores de IA, los detectores generan falsos positivos sobre alumnos que no han tocado ningún chatbot, y esos alumnos recurren a humanizadores (o directamente a escribir peor) para esquivar las acusaciones.

Joseph Thibault, fundador de Cursive, ha rastreado 43 humanizadores con una audiencia combinada de 33,9 millones de visitas. Grammarly ha desarrollado, por ejemplo, Authorship, una herramienta que graba la sesión de escritura para que los estudiantes puedan demostrar que redactaron ellos el trabajo: según la propia empresa, se generaron cinco millones de informes de ese tipo en el último año. Una profesora declara en el artículo: "Cuanto mejor escribes, la IA más cree que eres IA. Yo pongo mis propios artículos en los detectores solo para entender cómo funcionan, y me marca al 98% siempre, sin haber usado IA en ningún momento."

En Xataka

Las herramientas para detectar textos hechos con IA son flojas nivel: creen que 'Cien años de soledad' es IA

Abajo los ensayos. El escándalo de 'Granta' ocurre mientras el mercado editorial registra otro síntoma del mismo problema. Según datos del Wall Street Journal que también recoge Res Obscura, el libro de no ficción más vendido de abril en Estados Unidos ('London Falling', de Patrick Radden Keefe) colocó 13.468 copias en su primera semana; la primera novela rozó las 105.000. El presidente de Harper Group lo atribuye a los podcasts: según una encuesta reciente, el 62% de los hombres y el 54% de las mujeres escucharon uno el mes pasado, frente al 46% y el 39% de 2023. La razón es la misma que llevó antes a YouTube: prometen saciar en cuarenta minutos lo que a un libro le lleva satisfacer tres semanas.

La IA es el siguiente escalón: no compite con libros ni podcasts, sino que los sustituye con un resumen generado en diez segundos que responde preguntas sin que nadie haya tenido que escribir, editar ni leer nada. El problema, como apunta Breen, es que ese modelo apunta a respuestas inmediatas y elimina precisamente lo que hace valioso al libro de no ficción: la necesidad de atención, la permanencia en el tiempo y todos los matices reflexivos que esto implica.

Cuando la IA copia a un autor concreto. La escritora Vauhini Vara fue más lejos. Como contó en Vox, encargó al investigador Tuhin Chakrabarty que entrenara un modelo sobre sus tres libros publicados y varios artículos periodísticos para que generara pasajes de, teóricamente, su próxima novela. Luego los mezcló con fragmentos propios y los envió a sus amigos más cercanos. Ninguno supo distinguirlos.

Es más: otra conclusión que sacaron del experimento es que los lectores tienden a preferir el texto de IA sobre las imitaciones escritas por humanos cuando no conocen el origen. Cuando se les revela la fuente, el texto deja de interesarles. Vara extrae de ahí una conclusión: lo que importa a los lectores no es si el texto suena humano, sino saber que hay alguien de verdad al otro lado. Queremos recibir el texto de una persona, no de una máquina. Al menos podemos tener esa esperanza.

En Xataka | La IA tiene palabras favoritas como delve y ahora sabemos por qué. La respuesta está en Nigeria