Towards Robust Detection of Adversarial Examples Tianyu Pang, - - PowerPoint PPT Presentation

towards robust detection of adversarial examples
SMART_READER_LITE
LIVE PREVIEW

Towards Robust Detection of Adversarial Examples Tianyu Pang, - - PowerPoint PPT Presentation

Towards Robust Detection of Adversarial Examples Tianyu Pang, Chao Du, Yinpeng Dong and Jun Zhu Department of Computer Science and Technology Tsinghua University TSAIL NeurIPS | 2018 Adversarial Examples From


slide-1
SLIDE 1

Towards Robust ¡Detection ¡of ¡Adversarial ¡Examples

Tianyu Pang, Chao Du, Yinpeng Dong and Jun Zhu

Department of Computer Science and Technology Tsinghua University

NeurIPS | ¡2018

TSAIL

slide-2
SLIDE 2

From ¡Dong ¡et ¡al. ¡(CVPR ¡2018)

Adversarial ¡Examples ¡

slide-3
SLIDE 3

We ¡Detect ¡Adversarial ¡Examples, ¡and ¡How? Design ¡new ¡detectors:

  • Kernel ¡density ¡detector ¡(Feinman ¡et ¡al. ¡2017)
  • LID ¡detector ¡(Ma ¡et ¡al. ¡ICLR ¡2018) ¡
  • ……
slide-4
SLIDE 4

We ¡Detect ¡Adversarial ¡Examples, ¡and ¡How? Design ¡new ¡detectors:

  • Kernel ¡density ¡detector ¡(Feinman ¡et ¡al. ¡2017)
  • LID ¡detector ¡(Ma ¡et ¡al. ¡ICLR ¡2018) ¡
  • ……

Train ¡the ¡models ¡to ¡better ¡collaborate ¡with ¡existing ¡detectors

slide-5
SLIDE 5

Reverse ¡Cross ¡Entropy

plane car bird cat deer dog frog horse ship truck plane car bird cat deer dog frog horse ship truck

Cross-­‑Entropy ¡(CE): Reverse ¡Cross-­‑Entropy ¡(RCE):

1": ¡One-­‑hot ¡label

𝓜𝑫𝑭 = −𝟐𝒛 * 𝐦𝐩𝐡(𝐆)

𝑆": ¡Reverse ¡label

𝓜𝑺𝑫𝑭 = −𝑺𝒛 * 𝐦𝐩𝐡(𝐆)

{0, ¡0, ¡0, ¡1, ¡0, ¡0, ¡0, ¡0, ¡0, ¡0} {

3 4, ¡ 3 4, ¡ 3 4, ¡0, ¡ 3 4, ¡ 3 4, ¡ 3 4, ¡ 3 4, ¡ 3 4, ¡ 3 4}

slide-6
SLIDE 6

The ¡RCE ¡Training ¡Method Phase ¡1: ¡Reverse ¡Training

Training ¡the ¡model ¡by ¡minimizing ¡the ¡RCE ¡loss

Phase ¡2: ¡Reverse ¡Logits

Negating ¡the ¡logits ¡fed ¡to ¡the ¡softmax ¡layer ¡to ¡give ¡predictions

slide-7
SLIDE 7

Theoretical ¡Analysis

Property ¡1: ¡Consistent ¡and ¡Unbiased When ¡the ¡training ¡error ¡𝜷 ⟶ 𝟏, ¡the ¡prediction ¡tends ¡to ¡the ¡one-­‑hot ¡label ¡ Property ¡2: ¡Tighter ¡Bound The ¡difference ¡between ¡any ¡two ¡non-­‑maximal ¡elements ¡decreases ¡as ¡𝚷(𝜷𝟑)

slide-8
SLIDE 8

Experiments CE RCE

t-­‑SNE ¡visualization ¡of ¡learned ¡features ¡on ¡CIFAR-­‑10

slide-9
SLIDE 9

Experiments

AUC-­‑scores ¡(𝟐𝟏:𝟑) ¡on ¡adversarial ¡examples

slide-10
SLIDE 10

For ¡more ¡results ¡and ¡analyses, ¡please ¡come ¡ Poster: ¡Room ¡210 ¡& ¡230 ¡AB ¡ #11 Code: ¡https://github.com/P2333/RCE

NeurIPS | ¡2018

TSAIL