パーソナルデータを保護しつつ利活用するための技術としてデータ合成が注目されており、諸外国では実用化も進んでいます。データ合成により、元のパーソナルデータから「合成データ」を作成できます。合成データは一般に、元のデータの統計的特徴をなるべく維持した架空の人物のデータとなり、有用性の高い匿名化データとして利活用が期待されています。しかし合成データの匿名性はデータ合成の手法に依存し、国内外でも合成データを匿名化データと認定する基準は定まっていません。そのため、匿名性の低い合成データの利用によるプライバシー侵害や、合成データを利用したくても基準が不明確のため利用できないといった事態が危惧されます。そこで情報処理学会 コンピュータセキュリティ研究会 PWS(Privacy Workshop)組織委員会は、データ合成技術の有識者および健全な合成データの利活用促進を目指す研究者・実務者からなるデータ合成技術評価委員会を立ち上げ、2023年4月から活動を開始しました。
健全な合成データの利活用促進に向け、既存のデータ合成手法の匿名性を評価するとともに、合成データの匿名性の基準の作成を目指します。具体的な検討結果や評価結果は本ホームページにて随時公開していく予定です。 2024年10月22日から25日に開催される「コンピュータセキュリティシンポジウム2024(CSS2024)」にて、現在までの活動内容を報告いたします。