La UE publica el contrato de las vacunas de Astrazeneca "censurado" en PDF y se olvida de quitar los marcadores, dejando parte a la vista

La UE publica el contrato de las vacunas de Astrazeneca "censurado" en PDF y se olvida de quitar los marcadores, dejando parte a la vista
21 comentarios Facebook Twitter Flipboard E-mail

La Unión Europea ha publicado el contrato de las vacunas de Astrazeneca hace algunas horas. Lo ha hecho en su web, en PDF, nada fuera de lo normal. Sin embargo, cualquiera que acceda al archivo verá que algunas partes (sobre todo las páginas 4 y 5) están tachadas. La Unión Europea y Astrazeneca han ocultado ciertos contenidos, pero parece que han cometido un pequeño error: no han eliminado los marcadores.

Cuando creas un PDF con formato, los títulos, subtítulos y listados de puntos se quedan indexados. Eso permite, por ejemplo, que en un PDF de 41 páginas, como es el caso, podamos ir rápidamente al punto que más nos interese. El problema es que los marcadores guardan parte del texto. Dicho de otro modo, parte de lo tachado es visible. O lo era, por la UE ha cambiado el archivo y el que hay ahora disponible ha sido corregido.

Cuidado con los marcadores

Marcadores
A la derecha el documento original tachado y a la izquierda el contenido mostrado en los marcadores.

Tal y como explican en la web de Adobe, "los marcadores se generan automáticamente durante la creación del PDF a partir de las entradas de la tabla de contenido de los documentos creados por la mayoría de los programas de autoedición. Esos marcadores suelen estar etiquetados y pueden usarse para realizar ediciones en el PDF".

Dichos marcadores tienen una jerarquía, así que se ordenan de mayor a menor: título del apartado, subtítulos y, en este caso, los puntos, a su vez jerarquizados en "1.", "a.", "i.", etc. El "problema" del PDF subido por la Unión Europea es que estos marcadores, al no haber sido eliminados, permiten acceder al contenido casi completo del texto.

Y decimos "casi" porque el lector de marcadores de Adobe Acrobat parece tener cierto límite de caracteres que puede mostrar. Tampoco indexa el contenido marcado como párrafo, por lo que si hay algo tachado en un párrafo suelto no se puede consultar, ni el contenido de las tablas. Pero no es el único tipo de "censura" que las entidades han aplicado. Hay una digital, que ya vemos que no es perfecta, y parece haber una analógica.

Diferencias Escaner
Arriba la página 10, abajo la página 11, que parece escaneada.

Los ejemplos los tenemos en las páginas 11 y 34. En ellas puede verse que las páginas parecen haberse añadido a posteriori, como si se hubieran impreso, escaneado y luego incrustado en el PDF. La letra se pixela, algo que no suele pasar en los PDFs, y además Adobe Acrobat no deja seleccionar el texto, sino que nos permite seleccionar una zona (algo que sucede cuando accedemos a un PDF escaneado).

Desgraciadamente, aquellos que quieran acceder al documento original no podrán, ya que el documento ha sido modificado. El que hay disponible en la web de la Unión Europea en estos momentos, que pesa casi tres veces más que el archivo original, no tiene marcadores, así que el contenido censurado no puede verse.

Comentarios cerrados
Inicio