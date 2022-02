Google es el Gran Hermano definitivo. Facebook no anda muy lejos: con lo que sabe de mí podría reconstruir mi vida cuando quisiera. Ahora bien: ¿cuánto sabe Amazon de mí?

Eso es lo que hemos querido averiguar ahora que la empresa da la opción de descargar todos los datos que recopila al usar sus servicios o productos como sus altavoces inteligentes. Hay buenas y malas noticias. Vamos con ellas.

Amazon recolecta un buen montón de datos. Esa es la realidad que uno puede confirmar al descargar todo lo que tiene sobre nosotros. El proceso para conseguir esos datos es sencillo: basta con hacer la solicitud siguiendo los pasos indicados en la documentación de Amazon.

De hecho para solicitar los datos tendremos que ir a este enlace indicado en esa documentación, lo que nos llevar´a a una página con un menú desplegable en el cual podemos elegir qué datos recolectados queremos descargar.

Podéis elegir cualquiera de las opciones mostradas en la imagen por si solo queréis esos datos en concreto. Por ejemplo, solo los de los dispositivos Alexa y Echo, solo los del Kindle o solo los de Publicidad. Yo quise descargar todos, así que elegí la opción "Solicitar todos tus datos" que se muestra en la parte inferior de ese menú desplegable.

A partir de ahí toca esperar. Y esperar mucho, porque esas peticiones tardan semanas en procesarse. En mi caso el correo electrónico que me avisaba de que los datos ya se podían descargar tardó 22 días en llegar desde que hice la petición.

Amazon además no hace especialmente rápida o cómoda la descarga de esos datos: en esa página web aparece una lista enorme de pequeños ficheros .ZIP que podemos descargar de forma individual: en ningún lado aparece una opción que permita descargarlos todos de una vez. Tendremos que ir haciendo clic en cada botón de "Descargar" para ir guardándolos en nuestro equipo.

Una vez descargados esos ficheros —en mi caso, cerca de 130— comencé a descomprimirlos. La mayoría de los cuales eran muy pequeños y estaban por debajo de los 10 KB, y al descomprimirlos se puede observar rápidamente como la inmensa mayoría son ficheros de texto en formato .CSV, preparados para ser importados en hojas de cálculo y que van mostrando información tabulada sobre nuestro uso de los productos y servicios de Amazon.

Ahora viene lo importante. ¿Qué datos recolecta Amazon? Tras analizar esos ficheros, pudimos comprobar cómo salvo en casos muy específicos la información que guarda de nosotros es justo la que se utiliza para su tienda online.

Así, Amazon guarda información sobre nuestras direcciones de envío —esto lo hace en uno de los pocos PDFs que aparecen en la colección de datos recolectados—, datos parciales sobre las tarjetas de crédito o débito que usamos para pagar los artículos (últimos cuatro dígitos, caducidad, banco asociado), y por supuesto tablas relacionadas con nuestra operativa en la web de Amazon: compras realizadas, devoluciones, lista de deseos, etc.

Que Amazon recolecte y almacene esos datos parece lógico teniendo en cuenta que los usamos al comprar artículos y usar la tienda online de Amazon. No hay aquí nada alarmante, o al menos no si efectivamente la información descargada en este segmento es toda la que Amazon almacena.

El resto de ficheros son en su mayoría también bastante inocuos. Tenemos un listado con los "mercados" ("marketplaces") en los que hemos entrado con alguno de nuestros dispositivos —por ejemplo, cuando descargamos juegos—, listados con entradas que indican si hemos aprovechado alguna promoción, o tablas con información sobre las notificaciones que Amazon nos ha mandado por correo electrónico.

Hay también una tabla —la derivada del fichero registration.csv— en la que se muestran los dispositivos en los que hemos usado la cuenta de Amazon, pero sin identificarlos claramente: aparecen sus números de serie y luego el nombre genérico que Amazon genera —por ejemplo, "Javier's 14th Android Device"— así como las fechas en las que se activó y desactivó la cuenta de Amazon en el dispositivo. Una vez más, datos razonables que es normal que Amazon tenga guardados como parte de nuestro historial de uso de sus servicios.

Lo único que encontré relativamente curioso fueron dos cosas. La primera, que Amazon sabe qué coche tengo. En realidad es algo totalmente normal, ya que he comprado algún recambio como el limpiaparabrisas allí.

La segunda, la que probablemente preocupa a más usuarios, y es qué tipo de datos recolecta Amazon de nuestro uso de sus altavoces inteligentes o de Prime Video. Su familia Echo es muy popular y da acceso a funciones cómodas a través de comandos de voz, pero ¿hasta qué punto se invade nuestra privacidad?

A juzgar por los datos recolectados, esa invasión parece una vez más casi nula. En los ficheros descargados en mi caso no había grabaciones de Alexa, pero la razón es sencilla: usamos la cuenta de Amazon de mi mujer para este dispositivo, porque la suya es la que está asociada a Prime.

Al final no importa si no los descargué, porque todo lo que graba Amazon cuando hablamos con Alexa queda registrado y accesible en el apartado de privacidad de Alexa de nuestra cuenta de Amazon. Al visitar esa página web veremos un listado de las órdenes de voz que hemos dado, y si desplegamos cualquiera de ellas podremos reproducir la cadena de audio que ha quedado grabada en los servidores de Amazon.

Al hacer un repaso a esas órdenes solo he podido encontrar clips de audio en los que controlaba la reproducción musical del altavoz o le preguntaba por el tiempo.

No hay grabaciones extrañas de conversaciones captadas en segundo plano por ejemplo, y una vez más parece que el comportamiento aquí de la recolección de datos es el esperado. En esa misma página web es además posible eliminar todas las grabaciones, lo que le da al usuario el control sobre esos ficheros.

Quizás lo más curioso de toda esa recolección de datos ha sido ver cómo Amazon recolecta bastante información sobre nuestras sesiones de lectura en sus lectores de libros electrónicos. Hay un buen número de ficheros relacionados con el Kindle, aunque la mayoría son una vez más inocuos.

Sin embargo hay algunos ficheros en los que hay un seguimiento claro de nuestra actividad de lectura. El fichero "Kindle.Devices.ReadingSession.csv" es el más revelador aquí: aparece hora de comienzo y fin de la sesión, identificador del libro electrónico a través de su código ASIN, y luego dos datos aún más curiosos: el tiempo que hemos estado leyendo (en milisegundos), y cuántas páginas pasamos en esa sesión.

Aquí hay desde luego una particular obsesión de Amazon por saber qué libros hemos leído y si esos libros nos han interesado o no. Esas métricas son muy similares a las que el servicio mantiene para Prime Video, y que muestran en tablas CSV cuál fue la película o serie que vimos y cuántos segundos estuvimos viéndola en cada sesión.

¿Es ese interés de Amazon legítimo? Bueno, ciertamente uno podría argumentar que gracias a eso Amazon sabe qué libros, series o películas funcionan en sus catálogos, así que desde ese punto de vista la recolección de esos datos que hacen en Amazon parece lógica.

That, and all the spreadsheets on *how* I read (page turns, highlights, reading sessions), my Whole Foods purchases, my contacts lists, my video watching, my Amazon purchases, every time I've entered a physical store, etc etc etc etc pic.twitter.com/3JROpVBjkO