脅威の研究

アバストの無料セキュリティも使うビッグデータと機械学習、AI(人工知能)の世界へようこそ

Martin Hron, 2017年10月17日

無料・有償版を問わず、アバストのインターネットセキュリティに搭載される「次世代型セキュリティシステム」とは? その背景にある ビッグデータ、機械学習、人工知能(AI)の世界の一端をご紹介します。

ビッグデータという言葉を聞いたことがおありでしょうか、実際に見たことはありますか? アバストでは、無料版、有償版のセキュリティソフトにかかわらず、世界の 4 億人を超えるユーザーを守るためにビッグデータをどのように活用しているかを皆様に深く理解していただくために、バーチャル リアリティの「ビッグデータの宇宙」を先日アメリカで開催された、MWCA(Mobile World Congress Americas)で公開させていただきました。

アバストでは数億人を超えるセキュリティソフトユーザーをネット上の脅威から守ると同時に、自社のセキュリティソフトをインストールしたデバイスに及ぶ脅威をビッグデータとして蓄積をしています。悪意を持つ脅威や、脅威となるかもしれない不審な「もの」がユーザーのシステムに侵入しようとした場合、弊社の 人工知能(AI)を基盤とした機械学習ネットワークはこの情報を処理し、潜在的な危険性を分析して、防御を強化するために必要な対策を講じます。

また、アバストのビッグデータは巨大な「レピュテーション データベース」への貢献という形でも役立っています。ユーザーが特定のURLにアクセスしたり、新しいプログラムを実行した場合、レピュテーションデータベースにその情報が蓄積され、その URL やプログラムに何人のユーザーがアクセスしたかのデータがわかるようになります。主流となっている安全なプログラムやウェブサイトには頻繁にアクセスが発生するため問題はないと判断されますが、万が一アクセスするユーザーの数が極端に少ないURLへのアクセスがある場合は、サイトの実態が説明とは異なる可能性があることが分かります。

Sandbox testing of file.png

上記のメッセージが表示された場合は、疑わしいファイルがサイバーキャプチャー プログラムで封鎖されたことを意味します。弊社はそのファイルを隔離されたサンドボックス環境に移動して実行します。サイバーキャプチャーがこの処理を行い、ファイルが安全であることが確認された後に、ユーザーはそのファイルに自由にアクセスできるようになります。しかし、さらに分析が必要だとサイバーキャプチャーが判断した場合、そのファイルは弊社の脅威研究所に送られ、詳細な検査が行われます。

ファイルの性質を深く調べるために、アバストでは「特徴ベクトル」と呼ばれるサンプルを抽出します。これはファイルの最も重要な特性の見本です。この情報はアバストの機械学習システムに入力され、あらゆるビッグデータとの比較検討が行われ、最終的にクリーン、悪意がある、または「必要ないかもしれないプログラム」(PUP) に分類されます。収集するビッグデータが多ければ多いほど、不審なファイルやプログラムを他の既知の脅威と比較しやすくなります。

アバストでは 1 日当たり数百万のファイルを処理するため、すでに極めて大規模なデータベースが構築されています。現在、プログラムの仮想的な「銀河系」ともいうべき、ほぼ 330 TiB に及ぶデータを保有していますが、これはアバストが提供する VR 体験が宇宙遊泳のように感じられる理由の ひとつでもあります。アバストのデータ アナリストは、機械学習プロセスをより詳細かつ迅速に調べて分類が適切であることを確認するために、この仮想世界に足を踏み入れています。究極的には、この機械学習と AI (人工知能)のバランスと、脅威アナリストからの助言によって、アバストは新規と既知の脅威からの保護を実現でき、これこそが次世代のサイバーセキュリティと呼ぶべきものです。