マルウェアの検体 - ロード・トゥ・ザ・ホワイトハッカー

マルウェアに感染したい人はいないと思うが、ウイルス対策ソフトの感度の測定やインシデント訓練などで、安全なマルウェアを使いたいことがある。

こちらの書籍で、取得方法が紹介されていた。

「セキュリティエンジニアのための機械学習」
――AI技術によるサイバーセキュリティ対策入門

こちらのブログの記載とかぶるところ多々。

書籍では、EBMERのデータセットを用いてマルウェア検出器を作成していた。

また、こちらのサイトが情報源として有益と紹介されていた。

その取得した検体をどのように活用するか？

マルウェアの検体の利用方法は、そのハッシュ値からシグネチャを生成して、判定するだけかと思っていました。それだと、ハッシュ値を偽装されるとマルウェアと判定されなくなる。

ディープラーニングを活用した判定では、マルウェアを画像化して、特徴が似ているか、という判定もされているようです。

こちらの論文にイメージが掲載されています。

マルウェアの指名手配写真。

イメージの作成方法は以下のステップ。

・マルウェアのバイナリデータを８ビットのベクトルへ変換

・8ビットベクトルからグレースケール画像へ変換

マルウェア検知をディープラーニングの得意な、画像処理にすることができる。

とはいえ、AIを騙す手法も存在しており、その辺りが課題のようです。

様々な角度から分析するための一つの手段としては、有益なのでしょう。