マルウェア対策研究人材育成ワークショップ 2008 (MWS 2008) は、サイバークリーンセンターで収集しているボット観測データを 「研究用データセット」 として活用するワークショップです。
「研究用データセット」を活用した研究として3つの分野を想定しています。
@検体解析技術の研究
A感染手法の検知ならびに解析技術の研究
Bボットの活動傾向把握技術の研究
マルウェア対策研究人材育成ワークショップ 2008 (MWS 2008) は、サイバークリーンセンターで収集しているボット観測データを 「研究用データセット」 として活用するワークショップです。
「研究用データセット」を活用した研究として3つの分野を想定しています。
@検体解析技術の研究
A感染手法の検知ならびに解析技術の研究
Bボットの活動傾向把握技術の研究
インターネットのセキュリティインシデント全般が見えにくくなっています。背景のひとつに、活動を見えにくくするためのマルウェア機能の高度化や運用が挙げられます。
このような状況下で、セキュリティインシデントの発生に迅速に対処するためには、先端的な研究者だけではなく、企業のネットワーク技術ならびにセキュリティ技術を開発する実務者もマルウェアに関する専門知識を備えていく必要があると考えています。
本ワークショップは、研究用データセットの提供、研究成果の共有ならびに切磋琢磨する環境の提供を通して、マルウェアに関する専門知識を備えた研究者/実務者を育成していくことを目的としています。
さらに、ワークショップ開催を研究用標準データを対象とした研究の立ち上げトリガにしたいと考えています。
マルウェア対策研究人材育成ワークショップ 2008では、サイバークリーンセンター (https://www.ccc.go.jp/) で収集しているボット観測データ CCC DATAset 2008 を 「研究用データセット」 として活用します。 また、「研究成果の共有」「切磋琢磨する環境」の場として、情報処理学会で開催するシンポジウム CSS2008 (http://css2008.la.coocan.jp/) を活用します。
研究用データセットの代表例として、1999年に米カリフォルニア大学により提供されたデータマイニング用の "KDD Cup 1999 Data" があります。このような研究用データセットは、評価するために精査されたデータ群ではありませんが、同じ研究用データセットを用いるため、研究者間で研究成果を共有することができます。
研究用標準データの代表例として、1999年に米リンカーン研究所が開発した "1999 DARPA Intrusion Detection Evaluation Data Set" があります。このデータは、侵入検知システムの有効性を確認するためのトラフィック評価データで、侵入検知技術の客観的な評価を行なうための評価データとしても活用されています。このような評価データは、技術の有効性や効果を客観的に確認するためのデータとして必要とされています。
マルウェア対策研究人材育成ワークショップ 2008 で使用する研究用データセット CCC DATAset 2008 は、マルウェア検体、攻撃通信データ、攻撃元データの3つから構成されたボット観測データ群です。
研究用データセットを提供するための観測装置(一般的に、おとりPC、ハニーポットと呼ばれている)で取得したマルウェアのハッシュ値
研究用データセットを提供するための観測装置で取得した通信のフルキャプチャデータ
研究用データセットを提供するための観測装置で取得したマルウェア取得時のログデータ(時刻, ダウンロードホストIPアドレス, 利用ポート番号/プロトコル、通信方向、ハッシュ値(SHA1)、ウイルス名称、ファイル名)