ADVERSARIAL EXAMPLES (In 15 minutes or less) Neill Patterson, MscAC - PowerPoint PPT Presentation

Apr 14, 2023 •191 likes •616 views

ADVERSARIAL EXAMPLES (In 15 minutes or less) Neill Patterson, MscAC PART I - BASIC CONCEPTS WE TRAIN MODELS BY TAKING GRADIENTS W.R.T. WEIGHTS w w r J w Panda Change weights via gradient descent WERE GOING TO TAKE GRADIENTS

ADVERSARIAL EXAMPLES (In 15 minutes or less) Neill Patterson, MscAC
PART I - BASIC CONCEPTS
WE TRAIN MODELS BY TAKING GRADIENTS W.R.T. WEIGHTS w w � η r J w
“Panda” Change weights via gradient descent
WE’RE GOING TO TAKE GRADIENTS W.R.T. PIXELS INSTEAD x x ± η r J x
WE ARE GOING TO TAKE GRADIENTS W.R.T. PIXELS INSTEAD x x ± η r J x
“Panda” Change pixels via gradient descent “Vulture”
KEY IDEA: ADD SMALL, WORST- CASE PIXEL DISTORTION TO CAUSE MISCLASSIFICATIONS
“Panda” “Gibbon” + = 58% confidence 99% confidence
THINK OF ADVERSARIAL EXAMPLES AS WORST-CASE DOPPLEGÄNGERS
DEMO
Sanja Fidler Fiddler Crab
PART II - HARNESSING ADVERSARIAL EXAMPLES
KEY IDEA: MAKE TRAINING MORE DIFFICULT TO GET STRONGER MODELS (DROPOUT, RANDOM NOISE, ETC)
TRAIN WITH ADVERSARIAL EXAMPLES FOR BETTER GENERALIZATION
THE FAST GRADIENT SIGN METHOD OF IAN GOODFELLOW
QUICKLY GENERATING ADVERSARIAL EXAMPLES
WHAT DIRECTION SHOULD YOU MOVE TOWARDS?
INSTEAD OF MOVING TOWARDS A SPECIFIC TYPE OF ERROR, MOVE AWAY FROM THE CORRECT LABEL
“House” “Panda” “Truck” “Vulture”
HOW BIG A STEP SHOULD YOU TAKE IF YOU WANT IMPERCEPTIBLE DISTORTION?
PIXELS ARE STORED AS SIGNED 8-BIT INTEGERS. ADD JUST LESS THAN1- BIT OF DISTORTION TO EACH PIXEL 0 . 07 < 1 2 7 ≈ 0 . 08
WE WANT PRECISELY THIS AMOUNT OF DISTORTION, SO NO MATTER HOW SMALL (OR BIG) THE GRADIENT, JUST TAKE THE SIGN OF IT AND MULTIPLY BY 0.07 x + 0 . 07 ⇥ sign ( r J x )
INCORPORATING ADVERSARIAL EXAMPLES INTO YOUR COST FUNCTION
GENERATE ADVERSARIAL EXAMPLES AT EACH ITERATION OF TRAINING, BUT DON’T WANT TO KEEP THEM AROUND IN MEMORY FOREVER
INSTEAD, MODIFY THE COST FUNCTION TO BE A COMBINATION OF ORIGINAL AND ADVERSARIAL INPUTS
New cost function e J ( θ , x , y ) = Parameters labels inputs
Old cost function e J ( θ , x , y ) = J ( θ , x , y ) +
Old cost function e J ( θ , x + ✏ sign r x J } , y ) J ( θ , x , y ) = J ( θ , x , y ) + | {z Adversarial example
e J ( θ , x , y ) = J ( θ , x , y ) + (1 − α ) J ( θ , x + ✏ sign r x J, y ) α mixing components
e J ( θ , x , y ) = J ( θ , x , y ) + (1 − α ) J ( θ , x + ✏ sign r x J, y ) α “Train with a mix of original and adversarial examples”
NOW DO S.G.D. ON THIS NEW COST FUNCTION, BY TAKING GRADIENTS W.R.T. WEIGHTS w w � η r e J w
PART III - MISCELLANEOUS TIPS FOR TRAINING
YOU NEED MORE MODEL CAPACITY (ADVERSARIAL EXAMPLES DO NOT LIE ON THE MANIFOLD OF REALISTIC IMAGES)
FOR EARLY STOPPING, BASE YOUR DECISION ON THE VALIDATION ERROR OF ADVERSARIAL EXAMPLES ONLY
RESULTS
BETTER GENERALIZATION ABOVE AND BEYOND DROPOUT 0.94% error 0.84% error (MNIST)
BETTER GENERALIZATION ABOVE AND BEYOND DROPOUT 0.94% error 0.84% error (MNIST)
RESISTANCE TO ADVERSARIAL EXAMPLES 89.4% error 17.9% error (97.6% confidence)
MATHEMATICAL PROPERTIES OF ADVERSARIAL EXAMPLES
MATHEMATICAL PROPERTIES OF ADVERSARIAL EXAMPLES (Ain’t nobody got time for that)
THANK YOU FOR YOUR TIME!

Recommend

Synthesizing Robust Adversarial Examples Anish Athalye, Logan Engstrom, Andrew Ilyas*, Kevin

Synthesizing Robust Adversarial Examples Anish Athalye*, Logan Engstrom*, Andrew Ilyas*, Kevin Kwok Adversarial examples Adversarial examples Imperceptible perturbations to an input can change a neural network's prediction adversarial

1.06k views • 23 slides

Adversarial Examples and Adversarial Training Ian Goodfellow, Sta ff Research Scientist, Google

Adversarial Examples and Adversarial Training Ian Goodfellow, Sta ff Research Scientist, Google Brain CS 231n, Stanford University, 2017-05-30 Overview What are adversarial examples? Why do they happen? How can they be used to

868 views • 43 slides

Neglected topics CS 446 Adversarial examples and deep networks 1 / 23 Adversarial

Neglected topics CS 446 Adversarial examples and deep networks 1 / 23 Adversarial examples? Standard ML setup: We have training data; try to do well on withheld testing data. Adversarial/robust ML setup: We have training

672 views • 27 slides

Confidence-Calibrated Adversarial Training Generalizing to Unseen Attacks David Stutz, Matthias

Confidence-Calibrated Adversarial Training Generalizing to Unseen Attacks David Stutz, Matthias Hein, Bernt Schiele 2-Minute Overview Problem: Robustness to various adversarial examples. Adversarial training on L adversarial examples:

635 views • 34 slides

CSC321 Lecture 22: Adversarial Learning Roger Grosse Roger Grosse CSC321 Lecture 22: Adversarial

CSC321 Lecture 22: Adversarial Learning Roger Grosse Roger Grosse CSC321 Lecture 22: Adversarial Learning 1 / 26 Overview Two topics for today: Adversarial examples: examples carefully crafted to cause an undesirable behavior (e.g.

412 views • 26 slides

A Closer Look at Adversarial Examples for Separated Data Kamalika Chaudhuri University of

A Closer Look at Adversarial Examples for Separated Data Kamalika Chaudhuri University of California, San Diego Adversarial Examples Gibbon Panda Small perturbation to legitimate inputs causing misclassification Adversarial Examples Can

1.41k views • 42 slides

Adversarial Examples Hanxiao Liu April 2, 2018 1 / 22 Adversarial Examples Inputs to ML

Adversarial Examples Hanxiao Liu April 2, 2018 1 / 22 Adversarial Examples Inputs to ML models that an attacker has intentionally designed to cause the model to make a mistake 1 Why this is interesting: Safety. Interpretability.

881 views • 22 slides

Synthesizing Robust Adversarial Examples Anish Athalye, Logan Engstrom, Andrew Ilyas*, Kevin

Synthesizing Robust Adversarial Examples Anish Athalye*, Logan Engstrom*, Andrew Ilyas*, Kevin Kwok Standard Adversarial Examples Given image x ; target class y Maximize with projected gradient descent: Standard Adversarial Examples Standard

560 views • 15 slides

Deep Adversarial Learning for NLP 9:00 10:30 Introduction and Adversarial Training, GANs

Deep Adversarial Learning for NLP 9:00 10:30 Introduction and Adversarial Training, GANs William Wang 10:30 11:00 Break - 11:00 12:15 Adversarial Examples Sameer Singh 12:15 12:30 Conclusions and Question Answering William

1.75k views • 105 slides

Stronger and Faster Wasserstein Adversarial Attacks Kaiwen Wu kaiwen.wu@uwaterloo.ca Joint work

Stronger and Faster Wasserstein Adversarial Attacks Kaiwen Wu kaiwen.wu@uwaterloo.ca Joint work with Allen Wang and Yaoliang Yu K.Wu, A.Wang and Y.Yu Wasserstein Adversarial Attacks July 29, 2020 1 / 18 Adversarial Examples Adversarial

1.04k views • 38 slides

Adversarial Examples in NLP Sameer Singh sameer@uci.edu @sameer_ sameersingh.org What are

Slides: http://tiny.cc/adversarial Adversarial Examples in NLP Sameer Singh sameer@uci.edu @sameer_ sameersingh.org What are Adversarial Examples? panda gibbon 57.7% confidence 99.3% confidence [Goodfellow et al, ICLR 2015 ]

1.56k views • 43 slides

Thermometer Encoding: One Hot Way to Resist Adversarial Examples Stanford, 2017-11-16 Aurko Roy*

Thermometer Encoding: One Hot Way to Resist Adversarial Examples Stanford, 2017-11-16 Aurko Roy* Colin Ra ff el Jacob Ian Buckman* Goodfellow *joint first author Adversarial Examples Adversarial Definitely Probably panda perturbation

607 views • 15 slides

Reinforcing Adversarial Robustness using Model Confidence Induced by Adversarial Training Xi Wu

Reinforcing Adversarial Robustness using Model Confidence Induced by Adversarial Training Xi Wu xiwu@cs.wisc.edu Joint work with Uyeong Jang, Jiefeng Chen, Lingjiao Chen, and Somesh Jha July 19, 2018 Xi Wu Model Confidence and Adversarial

740 views • 9 slides

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist Guest

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist Guest lecture for CS 294-131, UC Berkeley, 2016-10-05 In this presentation Intriguing Properties of Neural Networks Szegedy et al, 2013

660 views • 44 slides

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist Presentation at HORSE 2016 London, 2016-09-19 In this presentation Intriguing Properties of Neural Networks Szegedy et al, 2013 Explaining

497 views • 22 slides

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist Presentation at San Francisco AI Meetup, 2016-08-18 In this presentation Intriguing Properties of Neural Networks Szegedy et al, 2013

690 views • 32 slides

2017 Annual General Meeting of Shareholders Charles Gibbon Chair WiseTech Global FY17

2017 Annual General Meeting of Shareholders Charles Gibbon Chair WiseTech Global FY17 financial highlights Delivered strong, high quality growth while expanding technology lead and global footprint (1) Acquisitions are those executed in

332 views • 17 slides

Typing AD Hoc Data Kathleen Fisher AT&T Labs Research 1 Data,Data,everywhere! Incredible

Typing AD Hoc Data Kathleen Fisher AT&T Labs Research 1 Data,Data,everywhere! Incredible amounts of data stored in well-behaved formats: Databases: Tools Schema Browsers Database Query Languages Standards Libraries XML: Books,

861 views • 59 slides

Beetle Family of Lightweight and Secure Authenticated Encryption Ciphers Avik Chakraborti 1 ,

Introduction Motivation Specification for Beetle Hardware Implementation Results of Beetle Conclusions Beetle Family of Lightweight and Secure Authenticated Encryption Ciphers Avik Chakraborti 1 , Nilanjan Datta 2 , Mridul Nandi 3 and Kan

614 views • 32 slides

Monge-Ampre Geometry and the Navier-Stokes Equations Ian Roulstone University of Surrey Joint

Monge-Ampre Geometry and the Navier-Stokes Equations Ian Roulstone University of Surrey Joint with Bertrand Banos and Volodya Roubtsov ( J Phys A 2016), and more recent work with Martin Wolf and Jock McOrist (Surrey) New Trends in Applied

527 views • 36 slides

Adversarial Domain Adaptation and Adversarial Robustness Judy Hoffman + = Big Deep success

Adversarial Domain Adaptation and Adversarial Robustness Judy Hoffman + = Big Deep success data learning Benchmark Performance 100 95 Accuracy 90 85 Millions of Images 80 Deep models 75 Challenge to recognize 1000

1.2k views • 60 slides

Shrinking and Exploring David Evans University of Virginia Adversarial Search Spaces ARO

evadeML. L.org Shrinking and Exploring David Evans University of Virginia Adversarial Search Spaces ARO Workshop on Adversarial Learning Stanford, 14 Sept 2017 Weilin Xu Yanjun Qi Machine Learning is Eating Computer Science 1 Security

552 views • 54 slides

A Framework and Implications for Archival Research Cal Lee School of Information and Library

Levels of Representation in Digital Collections: A Framework and Implications for Archival Research Cal Lee School of Information and Library Science University of North Carolina at Chapel Hill 5th Annual SAA Research Forum Chicago, IL August

448 views • 25 slides

Primate Life Cycles 60 50 40 30 20 10 0 Ring-tailed lemur Capuchin monkey Gibbon

Primate Life Cycles 60 50 40 30 20 10 0 Ring-tailed lemur Capuchin monkey Gibbon Chimpanzee Orang-utan Infant Juvenile Adult

316 views • 12 slides

ADVERSARIAL EXAMPLES (In 15 minutes or less) Neill Patterson, MscAC - PowerPoint PPT Presentation

ADVERSARIAL EXAMPLES (In 15 minutes or less) Neill Patterson, MscAC PART I - BASIC CONCEPTS WE TRAIN MODELS BY TAKING GRADIENTS W.R.T. WEIGHTS w w r J w Panda Change weights via gradient descent WERE GOING TO TAKE GRADIENTS

Synthesizing Robust Adversarial Examples Anish Athalye*, Logan Engstrom*, Andrew Ilyas*, Kevin

Adversarial Examples and Adversarial Training Ian Goodfellow, Sta ff Research Scientist, Google

Neglected topics CS 446 Adversarial examples and deep networks 1 / 23 Adversarial

Confidence-Calibrated Adversarial Training Generalizing to Unseen Attacks David Stutz, Matthias

CSC321 Lecture 22: Adversarial Learning Roger Grosse Roger Grosse CSC321 Lecture 22: Adversarial

A Closer Look at Adversarial Examples for Separated Data Kamalika Chaudhuri University of

Adversarial Examples Hanxiao Liu April 2, 2018 1 / 22 Adversarial Examples Inputs to ML

Synthesizing Robust Adversarial Examples Anish Athalye*, Logan Engstrom*, Andrew Ilyas*, Kevin

Deep Adversarial Learning for NLP 9:00 10:30 Introduction and Adversarial Training, GANs

Stronger and Faster Wasserstein Adversarial Attacks Kaiwen Wu kaiwen.wu@uwaterloo.ca Joint work

Adversarial Examples in NLP Sameer Singh sameer@uci.edu @sameer_ sameersingh.org What are

Thermometer Encoding: One Hot Way to Resist Adversarial Examples Stanford, 2017-11-16 Aurko Roy*

Reinforcing Adversarial Robustness using Model Confidence Induced by Adversarial Training Xi Wu

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist Guest

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist

Adversarial Examples and Adversarial Training Ian Goodfellow, OpenAI Research Scientist

2017 Annual General Meeting of Shareholders Charles Gibbon Chair WiseTech Global FY17

Typing AD Hoc Data Kathleen Fisher AT&amp;T Labs Research 1 Data,Data,everywhere! Incredible

Beetle Family of Lightweight and Secure Authenticated Encryption Ciphers Avik Chakraborti 1 ,

Monge-Ampre Geometry and the Navier-Stokes Equations Ian Roulstone University of Surrey Joint

Adversarial Domain Adaptation and Adversarial Robustness Judy Hoffman + = Big Deep success

Shrinking and Exploring David Evans University of Virginia Adversarial Search Spaces ARO

A Framework and Implications for Archival Research Cal Lee School of Information and Library

Primate Life Cycles 60 50 40 30 20 10 0 Ring-tailed lemur Capuchin monkey Gibbon

Synthesizing Robust Adversarial Examples Anish Athalye, Logan Engstrom, Andrew Ilyas*, Kevin

Synthesizing Robust Adversarial Examples Anish Athalye, Logan Engstrom, Andrew Ilyas*, Kevin

Typing AD Hoc Data Kathleen Fisher AT&T Labs Research 1 Data,Data,everywhere! Incredible