Safe Exploration for Optimization with Gaussian Processes Yanan Sui - PowerPoint PPT Presentation

Safe Exploration for Optimization with Gaussian Processes Yanan Sui Alkis Gotovos Joel W. Burdick Andreas Krause Caltech ETH Zurich Caltech ETH Zurich

Better safe than sorry youtube.com/user/mattessons Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 2

Therapeutic spinal cord stimulation girardgibbs.com sjm.com maximize muscle activity negative efgects on treatment Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 3 ◮ Find electrode confjgurations that ◮ Bad confjgurations may cause pain or have

Goal Optimize an unknown reward function via sequential sampling AND remain “safe” throughout the process Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 4

Problem statement Safety threshold Seed set of safe decisions ( ) Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 5 ◮ Finite decision set D ◮ Unknown reward function f : D → R h

Problem statement Seed set of safe decisions ( ) Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 6 ◮ Finite decision set D ◮ Unknown reward function f : D → R ◮ Safety threshold h ∈ R h

Problem statement Seed set of safe decisions ( ) Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 7 ◮ Finite decision set D ◮ Unknown reward function f : D → R ◮ Safety threshold h ∈ R h

Safe Exploration for Optimization with Gaussian Processes Problem statement Alkis Gotovos 8 ◮ Finite decision set D ◮ Unknown reward function f : D → R ◮ Safety threshold h ∈ R ◮ Seed set S 0 of safe decisions ( ∀ x ∈ S 0 , f ( x ) ≥ h ) h

Problem statement Sequential sampling Goal Find argmax Remain safe: Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 9 ◮ For t = 1 , 2 , . . . ◮ select x t ∈ D ◮ observe f ( x t ) + n t

Problem statement Sequential sampling Goal Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 10 ◮ For t = 1 , 2 , . . . ◮ select x t ∈ D ◮ observe f ( x t ) + n t ◮ Find x ∗ ∈ argmax x ∈ D f ( x ) ◮ Remain safe: ∀ t ≥ 1 , f ( x t ) ≥ h

Problem statement Sequential sampling Goal Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 11 ◮ For t = 1 , 2 , . . . ◮ select x t ∈ D ◮ observe f ( x t ) + n t ◮ Find x ∗ ∈ argmax x ∈ D f ( x ) Remain safe: ∀ t ≥ 1 , f ( x t ) ≥ h ◮

Related work Various proposed criteria, e.g., Expected improvement [Mockus et al., 1974] UCB [Auer, 2002] [Srinivas et al., 2010] Related variants Level set estimation [Gotovos et al., 2013] Bayesian optimization with constraints [Gardner et al., 2014] Gaussian processes popular for modeling the unknown function Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 12 ◮ Bayesian optimization: function evaluation is expensive

Related work Related variants Level set estimation [Gotovos et al., 2013] Bayesian optimization with constraints [Gardner et al., 2014] Gaussian processes popular for modeling the unknown function Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 13 ◮ Bayesian optimization: function evaluation is expensive ◮ Various proposed criteria, e.g., ◮ Expected improvement [Mockus et al., 1974] ◮ UCB [Auer, 2002] [Srinivas et al., 2010]

Gaussian processes popular for modeling the unknown function Related work Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 14 ◮ Bayesian optimization: function evaluation is expensive ◮ Various proposed criteria, e.g., ◮ Expected improvement [Mockus et al., 1974] ◮ UCB [Auer, 2002] [Srinivas et al., 2010] ◮ Related variants ◮ Level set estimation [Gotovos et al., 2013] ◮ Bayesian optimization with constraints [Gardner et al., 2014]

Related work Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 15 ◮ Bayesian optimization: function evaluation is expensive ◮ Various proposed criteria, e.g., ◮ Expected improvement [Mockus et al., 1974] ◮ UCB [Auer, 2002] [Srinivas et al., 2010] ◮ Related variants ◮ Level set estimation [Gotovos et al., 2013] ◮ Bayesian optimization with constraints [Gardner et al., 2014] ◮ Gaussian processes popular for modeling the unknown function

Gaussian process regression Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 16

Gaussian process regression Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 21 u t ( x ) ℓ t ( x ) x

GP-UCB argmax Sublinear regret under suitable conditions on [Srinivas et al., 2010] Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 22 ◮ Use upper confjdence bounds for optimistic sampling

GP-UCB Sublinear regret under suitable conditions on [Srinivas et al., 2010] Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 23 ◮ Use upper confjdence bounds for optimistic sampling ◮ x t = argmax x ∈ D u t ( x )

GP-UCB Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 24 ◮ Use upper confjdence bounds for optimistic sampling ◮ x t = argmax x ∈ D u t ( x ) ◮ Sublinear regret under suitable conditions on f [Srinivas et al., 2010]

Alkis Gotovos Safe Exploration for Optimization with Gaussian Processes 25 GP-UCB example ( t = 0 )

Certifying safety If for some safe we know , then a safety certifjcate for is Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 29 ◮ Assume that f is L -Lipschitz continuous w.r.t. a metric d

Certifying safety Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 30 ◮ Assume that f is L -Lipschitz continuous w.r.t. a metric d ◮ If for some safe x we know f ( x ) , then a safety certifjcate for x ′ is f ( x ) − L d ( x, x ′ ) ≥ h

Certifying safety Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 31 S 0

Certifying safety Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 32

Certifying safety Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 40 ¯ R 0 ( S 0 )

Reachability Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 43

Reachability Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 46 ¯ R ϵ ( S 0 )

Reconsidering optimization Instead, aim for the -reachable maximum max Smaller stricter goal need more samples Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 47 ◮ Initial goal of fjnding f ∗ = max x ∈ D f ( x ) is unrealistic

Reconsidering optimization max Smaller stricter goal need more samples Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 48 ◮ Initial goal of fjnding f ∗ = max x ∈ D f ( x ) is unrealistic ◮ Instead, aim for the ϵ -reachable maximum f ∗ ϵ = R ϵ ( S 0 ) f ( x ) x ∈ ¯

Reconsidering optimization max Safe Exploration for Optimization with Gaussian Processes Alkis Gotovos 49 ◮ Initial goal of fjnding f ∗ = max x ∈ D f ( x ) is unrealistic ◮ Instead, aim for the ϵ -reachable maximum f ∗ ϵ = R ϵ ( S 0 ) f ( x ) x ∈ ¯ ◮ Smaller ϵ → stricter goal → need more samples

Safe Exploration for Optimization with Gaussian Processes Yanan Sui - PowerPoint PPT Presentation

Safe Exploration for Optimization with Gaussian Processes Yanan Sui Alkis Gotovos Joel W. Burdick Andreas Krause Caltech ETH Zurich Caltech ETH Zurich Better safe than sorry youtube.com/user/mattessons Safe Exploration for Optimization

Gaussian Filter The Gaussian filter 1 2 1 A Gaussian kernel gives less 1 2 4 2 weight to

CSci 8980: Advanced Topics in Graphical Models Gaussian Processes Instructor: Arindam Banerjee

Gaussian Processes Dan Cervone NYU CDS November 10, 2015 Dan Cervone (NYU CDS) Gaussian

CMPUT 466 Introduction to Gaussian Processes Dan Lizotte The Plan Introduction to Gaussian

Non-Gaussian likelihoods for Gaussian Processes Alan Saul Outline Motivation Non-Gaussian

Lecture 3 Capacity of Multiuser Gaussian Channels The Gaussian uplink: 6.1 The fading

State Space Gaussian Processes with Non-Gaussian Likelihoods Hannes Nickisch 1 Arno Solin 2

My research over Bayesian Optimization and Gaussian Processes Eduardo C. GarridoMerch an

Another introduction to Gaussian Processes Richard Wilkinson School of Maths and Statistics

Gaussian Processes for Big Data James Hensman joint work with Nicol o Fusi, Neil D. Lawrence

Gaussian Processes Seung-Hoon Na Chonbuk National University Gaussian Process Regression

Faster Gaussian Lattice Sampling using Information Leakage Gaussian Sampling Our Work Lazy

CS70: Jean Walrand: Lecture 36. Gaussian and CLT CS70: Jean Walrand: Lecture 36. Gaussian and

Adversarially Robust Optimization with Gaussian Processes Ilija Bogunovic, Jonathan Scarlett,

Determining the PSF over the Full FoV of LSST using Anisotropic Gaussian Processes

Scalable Gaussian Processes Zhenwen Dai Amazon September 4, 2018 @GPSS2018 Zhenwen Dai (Amazon)

GArTPC configuration Jen Raaf, Alan Bross DUNE Near Detector WG Meeting 2017/10/19 LAr + GAr

Title of the Presentation Anna Karpi ska 1, *, Aiva Simaite 1 , and Matej Buzgo 1 1 InoCure

and Computer Sciences EECS 16A Head TAs Email: head-ta-ee16a@berkeley.edu Email Harrison

Fredericksburg High School Suborbital Aeroscience Studies Raising The Bar of Technology

Using Single Neuron Dynamics to Predict Synchronous Global Network Activities Robert Kim

The deep reservoir of the Travale geothermal area: mineralogical, geochemical and resistivity

Teaching the concept of energy using analogies between solar energy converters TPI-15 / ELTE

Minnesota Local Section of the American Chemical Society Serving chemists, educators, industry