Segurança Cibernética

Como a Inteligência Artificial leva a melhor sobre os cibercriminosos

Threat Intelligence Team, 5 Julho 2017

Longe dos sonhos da ficção científica, a IA (com algoritmos de aprendizado de máquina e big data) é crucial para neutralizar as ameaças cibernéticas atuais.

A inteligência artificial (IA) é a nova e mais quente tendência dos últimos anos. Embora possa parecer contraditório, há um motivo pelo qual a agitação em torno da IA e seus derivados, como o aprendizado de máquina, não cessaram e devem continuar por um longo tempo: sua importância singular em nossa luta contra o número e a variedade cada vez maior de ameaças cibernéticas.

A IA tem mais de 60 anos

O campo de pesquisa em IA começou em 1956, com os cientistas que trabalhavam no projeto de pesquisa de verão de Dartmouth sobre inteligência artificial. Desde então, a IA foi representada em muitos filmes, normalmente na forma de robôs com pensamentos e sentimentos humanos. A IA na vida real, no entanto, é muito diferente e mais ampla do que aquela que vemos nos filmes.

A IA é a ciência de fazer os computadores executarem suas tarefas através da imitação da inteligência humana e é usada em setores como saúde, atendimento ao cliente e financeiro. De interesse particular e um derivado da IA é o processo através do qual os computadores criam algoritmos de aprendizado de máquina para tomar decisões sobre padrões em dados, aprendendo assim com as análises da big data que eles executam. Na Avast, usamos IA e aprendizado de máquina há anos para proteger os nossos usuários de ameaças prevalentes. Um dos nossos mecanismos, o MDE, usa aprendizado de máquina que foi projetado internamente por nossos especialistas de segurança em 2012.

Por que mesmo os analistas humanos mais inteligentes não conseguem dar conta?

Nos primeiros dias da computação e da internet, usávamos assinaturas de vírus baseadas em strings para generalizar variantes de uma ameaça. As assinaturas exigem um analista e tempo, além de não serem flexíveis o suficiente para detectar a grande variedade de ameaças cibernéticas modernas, que proliferaram precisamente por serem muito lucrativas aos cibercriminosos. Não há pessoas suficientes ou tempo para acompanhar o número absoluto de novas ameaças, por isso, a IA e o aprendizado de máquina entram em cena.

O aprendizado de máquina e a IA são vitais à segurança, pois os criminosos cibernéticos em todo o mundo trabalham o tempo todo para criar novas variantes de malwares, que frequentemente se parecem com arquivos limpos, além de malwares que podem se transformar, tornando-se em ameaças ainda mais difíceis de serem detectadas pelos mecanismos antivírus. Para piorar, malwares também são vendidos na dark web, permitindo que pessoas com muito pouco conhecimento técnico alterem e disseminem novas famílias de malwares.

Claro que os analistas humanos podem verificar arquivos e determinar se são malignos ou não, mas isso exige que analisem o código dos arquivos, verificando se há características malignas. Analisar dessa maneira cada arquivo é fisicamente impossível, considerando que nos deparamos com mais de um milhão de novos arquivos todos os dias você não vai querer um escaneador ou removedor de malware que dependa apenas do poder humano.

Computadores, por outro lado, são bons em tratar números. Para que eles possam fazer o que os analistas fazem manualmente, criamos algoritmos que convertem arquivos em representações numéricas adequadas. Esses algoritmos de aprendizado de máquina extraem certas características ou “impressões digitais” dos arquivos que recebem. O que é extraído é muito menor que os arquivos originais, assim adequado a um pesado processamento e, especialmente importante, para uma rápida tomada de decisão.

Nunca paramos de aprender

Como o panorama das ameaças continua a evoluir, atualizamos permanentemente o conhecimento de nossas máquinas sobre arquivos limpos e malignos, para que elas consigam diferenciar melhor entre os dois tipos. Para conseguir isso, nossos analistas convertem suas descobertas sobre as novas técnicas dos autores de malware em novos algoritmos, que nossas máquinas usam para aprender como tomar decisões quando elas recebem novos dados.

Claro, nossa capacidade de fazer isso depende dos dados que conseguimos colocar em nossos computadores que tratam os números. Quanto mais dados colocamos, mais precisas são as decisões tomadas por nossos sistemas. Por isso, graças a mais de 400 milhões de usuários no mundo, cujos dispositivos agem como sensores, temos uma enorme quantidade de informações, nas quais executamos análises de dados amplas para nos ajudar a determinar se um arquivo é maligno ou não. Em última análise, a combinação de big data, aprendizado de máquina e IA é o que nos permite fornecer a nossos usuários a melhor e mais rápida proteção antimalware.