Sociedad Jueves, 11 de enero de 2018

Los datos ocultos de las redes sociales de Nahir Galarza

Por cada foto publicada en Instagram, se esconde una minería de datos

Por Rodolfo Pardo - rpardo@losandes.com.ar

Nahir Galarza tiene 19 años, es estudiante de abogacía e hija de un policía. Despidió a su novio a través de Instagram, con una foto que decía ‘5 años juntos, peleando, yendo y viniendo pero siempre con el mismo amor. Te amo para siempre mi ángel‘, al mismo tiempo, era convocada por el fiscal para declarar, a raíz de haber sido la última persona que vio con vida a Fernando Pastorizzo.  Después de quedar detenida ese mismo día, su cuenta en Instagram se cerró de inmediato siendo imposible observar sus fotos, pero ahora, mientras sigue presa, su perfil en la red social se volvió a abrir con algunos cambios casi imperceptibles pero más que importantes en la causa. 

Desde su reapertura, @nahirgalarza es una de las cuentas más influyentes en Instagram, situación que nos llevó a analizarla utilizando una api de Instagram y accediendo a las peticiones a través de InstaR, que básicamente es un paquete de R que posibilita el ingreso y la obtención de los metadatos de cada foto subida a la red social basado en diferentes parámetros personalizables y en el tiempo.

¿Qué son los metadatos? 

Twitter, Instagram, Facebook, WhastApp y otras redes sociales saben muchas cosas de vos y esto se debe en gran medida a esos metadatos que son pequeños archivos que guardan para conocerte en profundidad y formar un patrón de comportamiento de tu persona y de tus amigos. Gracias a esto, recopila todas estas informaciones sin tu autorización: 

Lenguaje utilizado en la publicación 

Modelo de smartphone

Aplicación utilizada para publicar nativa o externa

Tu actividad diaria o semanal

  • Hashtags más usados
  • Tus últimos likes
  • Tus últimos comments

Para acceder a los mismos, la red social de Mark Zuckerberg nos pide crear una api con sus correspondientes códigos de accesos llamados access_token y access_token(secret). Hasta ahora parece complicado pero a medida que avancemos en la nota lo vas a ir entendiendo.

Una vez enviados a revisión y posteriormente autorizados, utilizamos los siguientes comandos para acceder a los datos y poder estudiar con detalles la cuenta. 

* Para explicarte cada comando utilizo #(numeral)

#Creo una variable llamada token que va a contener todos los códigos de accesos para que Instagram lo valide al momento de la petición de información

Token = c("ingreso mi access_token", "ingreso mi access_tokensecret") 

#Una vez validado, le pido que me guarde en una variable "cuentaNahir" todos los datos de la cuenta utilizando el token anterior

cuentaNahir <- getUser("nahirgalarza", Token) 

Este proceso nos devuelve todos los "metadatos" de la cuenta que son:

Cuenta id 1455684239 

Total likes: 30.045

Total comments: 12,310

Post: 55

Followers: 31.392

Cómo podemos observar, R nos mostró el ID de la cuenta. Un ID es un número único identificatorio de una cuenta en Instagram. Este número es lo que básicamente nos identifica en el data center de Facebook. 

R nos brinda la posibilidad de acceder a todo tipo de datos de la cuenta, tales como cantidad de likes en todas las imágenes o en algunas en particular, algo que viene creciendo de forma exponencial debido a la popularidad del caso y el conocimiento de su cuenta de Instagram. 

Para obtener datos en CSV y luego exportarlos, utilizamos el comando:

likes <- getLikes(id = 1455684239, Token) 

Una vez que tenemos el archivo, utilizamos el paquete iGraph amcharts para graficarlo y poder obtener una lectura más dinámica: 

Del mismo modo, obtenemos los comentarios que recibe mes a mes donde podemos apreciar un gran crecimiento en este último mes: 

comments <- getComments(id = 1455684239, Token) 

Hay otro dato llamativo que se puede obtener en este estudio a la cuenta de Nahir Galarza: de la cantidad de comentarios que recibe diariamente en su cuenta de Instagram, el 90% son comentarios negativos hacia su persona y familia.

Lamentablemente, ni con R ni con Python pudimos acceder a las dos fotos eliminadas por el perfil ya que fueron eliminadas de forma definitiva en la red social. 

Aunque pienses que acceder a los metadatos de tus publicaciones en Instagram es complejo, hay un camino más corto pero con menos datos. 

Accedé a tu cuenta de Instagram, dale clic a tu foto y copia la url que puede ser parecida a esto https://www.instagram.com/p/BcgGcrSBsBQ. 

Ahora, copia ese link luego de url= 

 https://api.instagram.com/oembed/?url=[[copia el link aquí] 

Si lo ingresaste bien, vas a ver algunos metadatos de tu foto en el explorador:

 

¿Y qué sucede con @NahirGalarza en Twitter?

En Twitter, Nahir protegió su cuenta ya que debido a la cantidad de tuits emitidos (14,9k) iba a ser muy difícil tener un control para ningún texto la perjudique aún más. Por lo pronto, intentamos acceder a su perfil con Python utilizando la librería Tweepy pero la api de Twitter nos prohibió el acceso. 

Te lo explico en este video:

Seguramente, los peritos informáticos a cargo de recopilar toda la información, utilizarán otras metodologías para seguir sumando pruebas tales como estudios de memoria RAM, ficheros, redes y conexiones, tanto para su teléfono celular como para cualquier pc de escritorio que tenga en su hogar. 

*Actualizamos: a las 10:00 am del día jueves 11 de enero, cerró su cuenta de Instagram