Tudo o que você precisa saber sobre a coleta de dados em mídias sociais

David Strom 25 jan 2021

Armadilhas em redes sociais, criadas por empresas e hackers, apresentam um risco para que as informações de contas de usuários efetivamente vazem

Um grande vazamento de dados* expôs mais de 300 milhões de contas de plataformas de mídias sociais. Entre elas, havia 192 milhões de registros de duas coleções do Instagram, 42 milhões de registros tirados do TikTok e mais 4 milhões do YouTube.

Os registros incluíam nomes de usuários, fotos de perfis, e-mails, números de telefone, idade, gênero e informações específicas sobre seguidores e outras formas de engajamento de cada conta. O vazamento envolveu dados coletados pela empresa Social Data: algumas horas após ser notificada, os compartilhamentos foram protegidos de forma apropriada.

Há muitas coisas interessantes sobre esse episódio: sua fonte, como os dados foram obtidos e como o impacto disso no consumo de mídias sociais.

A Social Data fica em Hong Kong e foi criada depois do fim de outra empresa chamada Deep Social. Aparentemente, essa última foi a coletora original dos dados vazados. As duas empresas oferecem dados demográficos e psicográficos de influenciadores de mídias sociais a grandes marcas de produtos de consumo. A Deep Social encerrou suas operações em 2018, depois que o Facebook a impediu de usar suas interfaces de dados de marketing e ameaçou processar a empresa. A Social Data deu início às suas operações em 2019. Há muitas outras agências de “marketing influenciador”* que vendem esse tipo de informação, caso você se interesse em saber mais sobre essa área da internet.

Até onde se sabe, usuários não pagam pelo uso de plataformas de mídias sociais. Essas empresas fazem dinheiro com a venda de publicidade. Para ser eficaz, as plataformas rastreiam as atividades de seus usuários e oferecem diversas interfaces aos anunciantes. Assim eles podem decidir onde seus anúncios devem aparecer conforme essas informações.

Mas também é possível abusar do poder dessas interfaces, o que acabou se tornando o problema com a Deep Social. Há duas formas como essas agências podem operar: uma é obedecendo às regras e conseguir os dados dos usuários da forma como o Facebook e outras plataformas planejaram. A outra é extrair os dados diretamente das páginas de cada perfil e torcer para que as plataformas sociais não percebam.

Essa extração acontece desde que a web foi inventada, no começo da década de 1990. Há boas chances de que alguém tenha copiado e armazenado o seu conteúdo publicado na web. O que acontece é que ferramentas automáticas de extração foram ficando cada vez melhores em evitar a sua detecção. A Cloudfare tem uma explicação mais técnica* sobre as operações desses “robôs coletores”, como são conhecidos.

Mas os robôs não são perfeitos e essas atividades são interceptadas. O melhor exemplo disso é o Clearview.ai*, que coletou imagens de usuários, implementou-as em sua ferramenta e depois as disponibilizou no mercado por meio da sua tecnologia de reconhecimento facial. Outro caso aconteceu em 2014 com o LinkedIn, quando alguém coletou milhares de perfis pessoais* e os utilizou em um site criado para seus próprios propósitos de recrutamento.

Que tipo de conteúdo está disponível aos coletores? Veja essa captura de tela da Comparitech, que ilustra o nível de detalhe de informações de uma conta de usuário do Instagram.

scrapingImagem: Comparitech

Como mitigar os riscos

Há formas distintas de se defender dos coletores de dados. Depende se você quer proteger conteúdo empresarial ou pessoal. Existem várias ferramentas que podem ajudar as empresas a detectarem o roubo e a reutilização de conteúdo web, incluindo o Cloudfare e o Imperva*. Mas isso vai além das necessidades de pessoas comuns. Isso significa que você precisa ficar mais atento sobre a postagem de suas fotos, vídeos e pensamentos polêmicos online. Você deve pensar sobre a seguinte questão:

  • Você ativa os tags de localização nas suas fotos e vídeos? Se você tem um smartphone Android, seria bom ver algumas recomendações de privacidade*.

  •  Suas contas sociais permitem que qualquer um veja seu endereço de e-mail, número de telefone e data de nascimento? Há boas chances de que você tenha incluído essas informações ao criar seu perfil no Facebook ou em outras plataformas, mas não tenha revisado seus dados de privacidade desde então. Você deve conferir essas configurações em toda plataforma de mídia social utilizada.

A Avast é líder global em segurança cibernética, protegendo centenas de milhões de usuários em todo o mundo. Saiba mais sobre os produtos que protegem sua vida digital em nosso site e receba todas as últimas notícias sobre como vencer as ameaças virtuais através do nosso Blog, no Facebook ou no Twitter.

* Original em inglês.

--> -->