¿Qué hay de las fugas de datos de Facebook, LinkedIn y Clubhouse?

Christopher Budd 27 abr 2021

Cuando se trata de tus datos, es mejor recordar que lo público siempre es público

Durante las últimas semanas, los datos de millones de usuarios de Facebook , LinkedIn y Clubhouse (sitios en inglés) se han filtrado en línea. De hecho, si sumamos los tres, equivale a información de más de mil millones de usuarios en conjunto. Pero es posible que también hayas escuchado a las tres compañías decir que no hubo un truco. Entonces, ¿cuál es el problema? 

Si te preocupa tu información personal, es posible que te estés preguntando qué está pasando, ya que estas dos cosas parecen contradictorias. Por un lado, está la realidad de que la información de más de mil millones de usuarios de estos servicios está disponible de repente. Por otro lado, los tres servicios dicen que no hubo "hackeo" detrás de esto. ¿Pueden ambos ser verdad? ¿Si es así, cómo?

Ambos son verdaderos. Son ciertos porque el problema detrás de estos tres eventos es algo llamado "scraping". En última instancia, los tres servicios han culpado al "scraping" de la recopilación de datos, y el scraping es diferente de un pirateo o un ataque. 

Es posible que la diferencia entre "scraping" y "piratear" no te importe: si tus datos están ahí fuera de cualquiera o todos estos eventos y no quieres que estén ahí, el resultado final es el mismo. Y, desafortunadamente, proteger tu información contra el scraping es tu trabajo. Nadie más lo hará por ti.

Por eso, es importante comprender qué es el scraping y cómo funciona. De esa manera, puedes tomar medidas para proteger mejor tu información personal de situaciones como esta en el futuro.

¿Qué es scraping?

"Scraping" es una forma abreviada de "raspado de pantalla". El raspado de pantalla es cuando un programa o script toma información de una página web o servicio y la copia, básicamente “raspando” la información de la pantalla.


Lectura adicional:
Todo lo que debe saber sobre el raspado de redes sociales
La fuga de datos de Facebook: Qué debe hacer hoy
Pasos simples para recuperar su privacidad de Facebook


Por ejemplo, si tienes un sitio web público con nombres y números de teléfono de personas en diferentes departamentos en páginas web separadas, alguien puede crear un programa o un script para "raspar" ese sitio web y recopilar todos esos nombres y números de teléfono de todos los que están separados. páginas y ponerlo en una lista.

En algunos casos, el scraping puede ser útil porque reúne datos dispersos en un solo lugar. Tener una sola lista de nombres y números de teléfono es más fácil de usar que buscar en varias páginas web. 

Lo más importante es que el scraping recopila datos que ya son accesibles . En nuestro ejemplo, es un sitio web público, por lo que lo único que sucedió es que la información que ya es pública se recopila y es más fácil de acceder y usar. Si se extrae información recopilada que aún no estaba accesible, sería un truco o un ataque. Pero el raspado en sí mismo no recopila datos que han estado ocultos o protegidos: solo recopila datos que ya estaban disponibles públicamente.

Las tres compañías han indicado que la información que está disponible ya estaba disponible públicamente y es el resultado de un scraping. En otras palabras, las personas han escrito scripts o programas que copian y recopilan información que ya era pública en sus servicios para crear estas listas masivas de datos.

Lo que hace que los resultados del scraping sean aterradores no es que se hayan filtrado nuevos datos; es que la información que ya era pública ahora se recopila en una forma diferente que es más fácil de almacenar, catalogar y buscar.

¿Qué puedes hacer con el scraping?

Lo más probable es que cuando te registres en cualquiera de estos servicios y publiques tu información públicamente, estés de acuerdo con que esa información se vea en una página de Facebook, LinkedIn o Clubhouse. Es posible que no hayas esperado que la información termine estando disponible públicamente en listas de big data como esta. Una cosa es saber que alguien puede encontrar tu número de teléfono navegando a una página de Facebook y encontrándolo allí. Es otra cosa saber que la información está ahora en archivos grandes que se pueden buscar en Internet.

Aquí es donde la distinción entre "piratear" y "scraping" debería ser más importante para ti.

Estas empresas tienen razón: no han sido pirateadas; la información ya era pública. Pero si no estás de acuerdo con que tu información termine en este formato, tendrás que tomar el asunto en tus propias manos.

Primero, es importante entender que cualquier información que sea pública siempre corre el riesgo de ser borrada. Ya sea una página web o una plataforma de redes sociales, es mejor recordar que, cuando se trata de datos, el público siempre es público. Cuando los datos son públicos, no tienes control sobre quién los copia y qué hacen con ellos. Si es público, puede estar en Internet fuera de su control para siempre.

En segundo lugar, la única forma de asegurarte de que tus datos públicos no se recopilen ni se utilicen de maneras inesperadas es simplemente no hacerlos públicos. Si no te sientes cómodo con la información que podría terminar en listas como esta, protégela usando controles de privacidad (si están disponibles) o, mejor aún, no la publiques en absoluto.

Y si tienes datos disponibles ahora que no deseas, ¿qué puedes hacer al respecto? Desafortunadamente nada. Por eso es tan importante asegurarse de que la información que publica es información sobre la que está bien perder el control. Porque una vez que está ahí, no hay forma de recuperarlo.

Al final, estas filtraciones de datos son un recordatorio de que la información pública es información pública y si deseas proteger tu información, la única forma de estar seguro es no hacerla pública. Es importante comprender esto porque hay muchas probabilidades de que haya más incidentes de scraping como este en el futuro. Y como hemos visto en estos casos, el único que puede proteger y protegerá tus datos contra el raspado eres tú. Y una vez que los datos están disponibles, no hay forma de recuperarlos.

--> -->