Segurança Cibernética

Scraping e vazamentos nas redes sociais

Avast Security Blogger, 24 de Agosto de 2021 21h32min25s CEST
Avast Security Blogger, 24 de Agosto de 2021 21h32min25s CEST

Quando se trata de seus dados, é melhor lembrar que o público é sempre público

Nos últimos meses, os dados de milhões de usuários do Facebook, do LinkedIn* e do Clubhouse* vazaram na internet. Na verdade, se você somar todos eles, os vazamentos equivalem a informações de mais de 1 bilhão de usuários coletivamente. Mas você também pode ouvir as três empresas falando que não houve uma invasão. Então, de que se trata? 

Se você está preocupado com suas informações pessoais, vai querer saber o que acontece, já que essas duas coisas parecem contraditórias. Por um lado, é fato que os dados de mais de um bilhão de usuários desses serviços está, de repente, disponível online. Por outro lado, os três serviços estão dizendo que “não foram hackeados”. Essas duas afirmações podem ser verdadeiras? E, em caso afirmativo, como isso é possível?

Ambas são verdadeiras. Elas são verdadeiras porque por trás de todos esses eventos encontra-se algo chamado “scraping” (ou “raspagem”, em tradução livre). Esses três serviços culparam o “scraping” pela coleta de dados, e “scraping” é diferente de um hack ou de um ataque. 

A diferença entre “scraping” e “hacking” pode não ser relevante para você: se seus dados estiverem expostos e você não queria que isso acontecesse, pouco importa qual foi o evento que causou o vazamento, o resultado é o mesmo. E, infelizmente, você é responsável por proteger suas informações contra “scraping”. Ninguém vai fazer isso por você.

Por esse motivo, é importante entender o que é “scraping” e como ele funciona. Dessa forma, você pode tomar medidas para proteger melhor suas informações pessoais de situações parecidas no futuro.

O que é scraping?

“Scraping” é abreviação de “scraping de tela” ("raspagem de tela”, em tradução livre), que ocorre quando um programa ou script obtém informações de uma página web ou de um serviço e as copia, basicamente “raspando” as informações da tela.

Por exemplo, em um site público com nomes e números de telefone das pessoas em diferentes departamentos nas páginas separadas, alguém pode construir um programa ou script para “raspar” esse site e fazer uma lista de todos esses nomes e números de telefone que estão em páginas separadas.

Em alguns casos, o “scraping” pode ser útil porque junta os dados dispersos em um só lugar. Consultar uma única lista de nomes e números de telefone é mais fácil do que ter que olhar em várias páginas web. 

Mais importante, o “scraping” reúne os dados que já estão acessíveis. Em nosso exemplo, usamos um site público. Assim, a única coisa que aconteceu é que as informações públicas ficaram reunidas e mais fáceis de acessar e usar. Se o “scraping” coletasse as informações que não fossem acessíveis, isso seria um “hack” ou uma invasão. Mas o “scraping” em si não coleta dados ocultos ou protegidos: coleta apenas os dados que já são públicos e disponíveis.

Todas as três empresas indicaram que todas as informações vazadas já estavam disponíveis publicamente e que o vazamento é o resultado de “scraping”. Em outras palavras, as pessoas escreveram scripts ou programas que copiam e coletam informações que já eram públicas para criar essas listas gigantes de dados.

Os resultados do “scraping” são assustadores não porque novos dados vazaram. Trata-se de informações que já são públicas e que, agora, estão reunidas em uma forma diferente, mais fácil de armazenar, catalogar e pesquisar.

O que você pode fazer quanto ao scraping?

Há grandes chances de que, quando você se inscreveu num desses serviços e disponibilizou suas informações publicamente, você queria que elas fossem visualizadas em uma página do Facebook, do LinkedIn ou do Clubhouse. Você provavelmente não esperava que as informações ficariam disponíveis publicamente em grandes listas de dados como essa. Uma coisa é saber que alguém pode encontrar o seu número de telefone visitando uma página no Facebook. E outra completamente diferente é saber que essas informações agora estão em arquivos grandes e pesquisáveis na Internet.

Por isso, a distinção entre um “hack” e uma “scraping” deve ser mais importante para você. Essas empresas estão certas: elas não foram hackeadas, essas informações já eram públicas. Mas se você não quer que suas informações terminem neste formato, você precisa cuidar disso por conta própria.

Primeiro, é importante entender que qualquer informação pública sempre corre risco de “scraping”. Seja em uma página web ou em uma plataforma de redes sociais, é melhor lembrar que os dados públicos são sempre públicos. Quando os dados são públicos, você não tem controle sobre quem os copia e o que ele faz com isso. Se forem públicos, os dados podem estar na internet fora do seu controle para sempre.

Segundo, o único jeito de garantir que seus dados públicos não sejam raspados, nem usados de maneiras inesperadas, é não os tornar públicos. Se você não se sente confortável com a possibilidade de as informações terminarem em listas como essa, proteja-as com controles de privacidade (quando disponíveis) ou, melhor ainda, não as divulgue.

Se seus dados estiverem disponíveis sem sua intenção, o que você pode fazer? Infelizmente, nada. Por isso, é muito importante ter certeza de que as informações que você torna públicas são as informações que você está disposto a deixar de controlar. Porque uma vez perdidas, não há como recuperá-las.

No final das contas, esses vazamentos de dados são um lembrete de que as informações públicas são públicas e se você deseja proteger as suas, a única maneira é não as tornar públicas. É importante entender isso porque é muito provável que, no futuro, haverá mais incidentes de “scraping” como esse. E, como vimos nesses casos, a única pessoa que pode proteger e protegerá seus dados contra “scraping” é você mesmo(a). E, uma vez que os dados são perdidos, não há como recuperá-los.


A Avast é líder global em segurança cibernética, protegendo centenas de milhões de usuários em todo o mundo. Saiba mais sobre os produtos que protegem sua vida digital em nosso site e receba todas as últimas notícias sobre como vencer as ameaças virtuais através do nosso Blog, no Facebook ou no Twitter.

* Original em inglês.