MWS について

マルウェア対策研究人材育成ワークショップ 2008 (MWS 2008) は、サイバークリーンセンターで収集しているボット観測データを 「研究用データセット」 として活用するワークショップです。
「研究用データセット」を活用した研究として3つの分野を想定しています。
@検体解析技術の研究
A感染手法の検知ならびに解析技術の研究
Bボットの活動傾向把握技術の研究


開催の目的

インターネットのセキュリティインシデント全般が見えにくくなっています。背景のひとつに、活動を見えにくくするためのマルウェア機能の高度化や運用が挙げられます。 このような状況下で、セキュリティインシデントの発生に迅速に対処するためには、先端的な研究者だけではなく、企業のネットワーク技術ならびにセキュリティ技術を開発する実務者もマルウェアに関する専門知識を備えていく必要があると考えています。
本ワークショップは、研究用データセットの提供、研究成果の共有ならびに切磋琢磨する環境の提供を通して、マルウェアに関する専門知識を備えた研究者/実務者を育成していくことを目的としています。

  1. 研究用データセットの提供
    トラヒック分析技術やマルウェア分析技術を研究/評価するための適切な素材を準備し、研究者(学生、ネットワーク技術ならびにセキュリティ技術を開発する実務者)に提供することで、以下の二点を実現します。
  2. 研究成果の共有
    同じ研究用データセットを用いて行った研究成果を本ワークショップで発表し、研究者間で共有することで、より具体的な成果の水平展開を図り、セキュリティ研究人材育成につなげます。
  3. 切磋琢磨する環境の提供
    同じ研究用データセットに基づく研究内容を共有することで、具体的なスキルアップ目標や、先進的な研究テーマの発見など、研究者の評価育成の場を形成します。

さらに、ワークショップ開催を研究用標準データを対象とした研究の立ち上げトリガにしたいと考えています。


研究用データセットの提供〜研究成果の共有〜切磋琢磨する環境の提供

マルウェア対策研究人材育成ワークショップ 2008では、サイバークリーンセンター (https://www.ccc.go.jp/) で収集しているボット観測データ CCC DATAset 2008 を 「研究用データセット」 として活用します。 また、「研究成果の共有」「切磋琢磨する環境」の場として、情報処理学会で開催するシンポジウム CSS2008 (http://css2008.la.coocan.jp/) を活用します。

研究用データセットの提供〜研究成果の共有〜切磋琢磨する環境の提供

研究用データセット

研究用データセットの代表例として、1999年に米カリフォルニア大学により提供されたデータマイニング用の "KDD Cup 1999 Data" があります。このような研究用データセットは、評価するために精査されたデータ群ではありませんが、同じ研究用データセットを用いるため、研究者間で研究成果を共有することができます。

研究用標準データ

研究用標準データの代表例として、1999年に米リンカーン研究所が開発した "1999 DARPA Intrusion Detection Evaluation Data Set" があります。このデータは、侵入検知システムの有効性を確認するためのトラフィック評価データで、侵入検知技術の客観的な評価を行なうための評価データとしても活用されています。このような評価データは、技術の有効性や効果を客観的に確認するためのデータとして必要とされています。


研究用データセット CCC DATAset 2008

マルウェア対策研究人材育成ワークショップ 2008 で使用する研究用データセット CCC DATAset 2008 は、マルウェア検体、攻撃通信データ、攻撃元データの3つから構成されたボット観測データ群です。

マルウェア検体 ⇒ @検体解析技術の研究

研究用データセットを提供するための観測装置(一般的に、おとりPC、ハニーポットと呼ばれている)で取得したマルウェアのハッシュ値

攻撃通信データ ⇒ A感染手法の検知ならびに解析技術の研究

研究用データセットを提供するための観測装置で取得した通信のフルキャプチャデータ

攻撃元データ ⇒ Bボットの活動傾向把握技術の研究

研究用データセットを提供するための観測装置で取得したマルウェア取得時のログデータ(時刻, ダウンロードホストIPアドレス, 利用ポート番号/プロトコル、通信方向、ハッシュ値(SHA1)、ウイルス名称、ファイル名)

研究用データセット(CCC DATAset 2008)