gp bayesfilters bayes filters cse 571
play

GP-BayesFilters Bayes Filters CSE-571 u(k-1) u(k) - PDF document

10/23/15 [Ko-F: RSS-08, ARJ-09] GP-BayesFilters Bayes Filters CSE-571 u(k-1) u(k) u(k+1) Q(k) Probabilis1c Robo1cs GP dynamics Dynamics s(k-1) model s(k) s(k+1) model Gaussian


  1. 10/23/15 [Ko-F: RSS-08, ARJ-09] GP-­‑BayesFilters ¡ Bayes ¡Filters ¡ CSE-­‑571 ¡ σ u(k-1) u(k) u(k+1) Q(k) Probabilis1c ¡Robo1cs ¡ µ ¡ GP dynamics Dynamics s(k-1) model s(k) s(k+1) model Gaussian ¡Processes ¡for ¡ Observation GP observation z(k-1) z(k) z(k+1) Bayesian ¡Filtering ¡ model model µ σ R(k) • Bayesian ¡filtering ¡ – Parametric ¡dynamics ¡and ¡observa1on ¡models ¡ – Approximate ¡posterior ¡via ¡sampling ¡(PF), ¡sigma ¡points ¡(UKF), ¡lineariza1on ¡ Dieter ¡Fox ¡ (EKF), ¡moment ¡matching ¡(ADF) ¡ • GP-­‑BayesFilters ¡ University ¡of ¡Washington ¡ – Use ¡Gaussian ¡Process ¡regression ¡to ¡learn ¡dynamics ¡and ¡observa1on ¡models ¡ ¡ – Noise ¡derived ¡from ¡GP ¡predic1on ¡uncertainty ¡ – Can ¡be ¡integrated ¡seamlessly ¡into ¡Bayes ¡filters: ¡EKF, ¡UKF, ¡PF, ¡ADF ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 1 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 2 ¡ [Ko-­‑Fox: ¡ARJ-­‑09] ¡ Overview ¡ GP-­‑BayesFilters ¡ • Learn ¡GP: ¡ ¡ • Gaussian ¡Processes ¡and ¡Bayes ¡Filters ¡ – Input: ¡Sequence ¡of ¡ground ¡truth ¡states ¡along ¡with ¡ • GP-­‑BayesFilters ¡ controls ¡and ¡observa1ons: ¡<s, ¡u, ¡z> ¡ – Learn ¡GPs ¡for ¡dynamics ¡and ¡observa1on ¡models ¡ • Filtering ¡and ¡Control ¡ • Filters ¡ • System ¡Iden1fica1on ¡with ¡GP-­‑BayesFilters ¡ – Par1cle ¡filter: ¡sample ¡from ¡dynamics ¡GP, ¡weigh ¡by ¡GP ¡ observa1on ¡func1on ¡ • Predic1ve ¡State ¡Representa1ons ¡ – EKF: ¡GP ¡for ¡mean ¡state, ¡GP ¡deriva1ve ¡for ¡lineariza1on ¡ • Conclusions ¡ – UKF: ¡GP ¡for ¡sigma ¡points ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 3 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 4 ¡ 1

  2. 10/23/15 Learning ¡GP ¡Dynamics ¡and ¡ GP-­‑PF ¡Propaga1on ¡ Observa1on ¡Models ¡ • Ground ¡truth ¡training ¡sequence: ¡ S k S k + 1 S = [ s 1 , s 2 ,..., s n ], Z = [ z 1 , z 2 ,..., z n ], U = [ u 1 , u 2 ,..., u n ] for m = 1... M : • Learn ¡observa1on ¡and ¡dynamics ¡GPs: ¡ ( ) + sample GP ( ) m = GP s k + 1 µ s k m , u Σ ( s k m ) GP observation s z k k model ¡ Δ s k = s k + 1 − s k GP dynamics [ ] s , k u model k • Propagate each particle using GP prediction = Δ s k − f ( s k , u k ) [ ] EGP dynamics r s , k u • Sample from GP uncertainty k model k • One GP mean and variance prediction per particle • Learn ¡separate ¡GP ¡for ¡each ¡output ¡dimension ¡ • Diagonal ¡noise ¡matrix ¡ 5 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 6 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ [Deisenroth-etal] introduced GP-ADFs and EP for smoothing in GP dynamical systems GP-­‑EKF ¡Propaga1on ¡ GP-­‑UKF ¡Propaga1on ¡ µ k , ∑ k µ k + 1 , ∑ k + 1 ( ) µ k , ∑ k µ k + 1 , ∑ k + 1 χ k = µ k − γ ∑ k µ k , µ k + γ ∑ k , µ k + 1 = GP µ ( µ k ) for i = 0...2 n : χ k + 1 = GP µ ( χ k ) G = ∂ GP µ ( µ k ) 2 n ∑ ∂ s µ k + 1 = ω m χ k + 1 i i ∑ k + 1 = G ∑ k G T + GP i = 0 Σ ( µ k ) 2 n ∑ ∑ k + 1 = ω c i ( χ k + 1 − µ k + 1 )( χ k + 1 − µ k + 1 ) T + GP Σ ( µ k ) i i i = 0 • Propagate mean using GP prediction • Propagate ¡each ¡sigma ¡point ¡using ¡GP ¡predic1on ¡ • Use gradient of GP to propagate covariance • 2d+1 ¡sigma ¡points ¡-­‑> ¡2d+1 ¡GP ¡mean ¡predic1ons ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 7 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 8 ¡ 2

  3. 10/23/15 [Ferris-­‑Haehnel-­‑Fox: ¡RSS-­‑06] ¡ Overview ¡ WiFi-­‑Based ¡Loca1on ¡Es1ma1on ¡ • Gaussian ¡Processes ¡and ¡Bayes ¡Filters ¡ • GP-­‑BayesFilters ¡ • Filtering ¡and ¡Control ¡ Mean ¡ • System ¡Iden1fica1on ¡with ¡GP-­‑BayesFilters ¡ • Predic1ve ¡State ¡Representa1ons ¡ • Conclusions ¡ Variance ¡ Similar to [Schwaighofer-etal: NIPS-03] ¡ 10 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 9 ¡ Building ¡Model ¡ Tracking ¡Example ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 11 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 12 ¡ 3

  4. 10/23/15 [Ko-­‑F: ¡ARJ-­‑09] ¡ Blimp ¡Testbed ¡ GP-­‑UKF ¡Tracking ¡Example ¡ • Task: Track a blimp with two webcams • Baseline: Parametric model that takes drag, thrust, gravity, etc, into account • Blue ¡ellipses: ¡sigma ¡points ¡projected ¡into ¡observa1on ¡space ¡ • GP-BayesFilters and parametric model trained on ground truth data • Green ¡ellipse: ¡Mean ¡state ¡es1mate ¡ obtained with Vicon motion capture system Amazon ¡ 13 ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 14 ¡ Dealing ¡with ¡Training ¡Data ¡Sparsity ¡ Tracking ¡Results ¡ ¡ ¡ ¡ ¡ Full ¡process ¡model ¡tracking ¡ Percentage reduction in RMS over parametric baseline ¡ • Parametric ¡model ¡takes ¡drag, ¡thrust, ¡gravity, ¡etc, ¡into ¡account ¡ ¡ • Cross ¡valida1on ¡with ¡900 ¡1mesteps ¡for ¡training ¡ No ¡right ¡turn ¡process ¡model ¡tracking ¡ • hetGP: ¡Heteroscedas1c ¡GP ¡with ¡variable ¡noise ¡ [Kers1ng-­‑etal: ¡ICML-­‑07] ¡ • Training ¡data ¡for ¡right ¡turns ¡removed ¡ • sparseGP: ¡sparsified ¡to ¡50 ¡ac1ve ¡points ¡ [Snelson-­‑Ghahramani: ¡NIPS-­‑06] ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 15 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 16 ¡ 4

  5. 10/23/15 ACT ¡Hand ¡Tendon ¡Arrangements ¡ ACT ¡Hand ¡Control ¡ • Tendon ¡hood ¡structure ¡for ¡extensors ¡ – Cri1cal ¡for ¡preserving ¡hand ¡func1onality ¡ – Slides ¡over ¡the ¡bones ¡and ¡joints ¡ • We ¡have ¡non-­‑linear, ¡non-­‑constant ¡rela1onships ¡ between ¡muscles ¡and ¡joints ¡ 1. Inves1ga1on ¡of ¡muscle-­‑joint ¡kinema1cal ¡rela1onship ¡ 2. How ¡to ¡control ¡joints ¡with ¡muscles? ¡ ¡ ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 17 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 18 ¡ [Wilkinson et al, ICRA 03] GP-­‑Based ¡Control ¡ Overview ¡ • Gaussian ¡Processes ¡and ¡Bayes ¡Filters ¡ • GP-­‑BayesFilters ¡ • Filtering ¡and ¡Control ¡ • System ¡Iden1fica1on ¡with ¡GP-­‑BayesFilters ¡ • Predic1ve ¡State ¡Representa1ons ¡ • Conclusions ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 19 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 20 ¡ 5

  6. 10/23/15 [Ko-F: RSS-09, ARJ-10] GP ¡Latent ¡Variable ¡Models ¡ GP ¡Latent ¡Variable ¡Models ¡ u u u u 1 2 3 n • Some1mes ¡ground ¡truth ¡states ¡are ¡not ¡or ¡only ¡ s s s s par1ally ¡available ¡ GP GP 1 2 3 n … GP GP GP GP • Instead ¡of ¡op1mizing ¡over ¡GP ¡hyperparameters ¡ z z z z 1 2 3 n only, ¡op1mize ¡over ¡latent ¡states ¡ S ¡as ¡well ¡ • Latent ¡variable ¡models ¡ [Lawrence: ¡NIPS-­‑03, ¡Wang-­‑etal: ¡PAMI-­‑08] ¡ • Learn ¡latent ¡states ¡and ¡GPs ¡in ¡one ¡op1miza1on ¡  ) argmax S , Θ Z , Θ S log p ( S , Θ Z , Θ S | Z , U , S  ) + log p ( Θ Z ) + log p ( Θ S ) + const = log p ( Z | S , Θ Z ) + log p ( S | U , Θ S ) + log p ( S | S • Can ¡take ¡noisy ¡labels ¡into ¡account ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 21 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 22 ¡ Slotcar ¡Testbed ¡ Simple ¡Trajectory ¡Replay ¡ • Learning ¡ ¡ u 1 u 2 – Human ¡demonstrates ¡control ¡ – Learn ¡latent ¡states ¡using ¡GPBF-­‑Learn ¡ GP GP u ¡ u ¡ – Learn ¡mapping ¡from ¡state ¡to ¡control ¡ s s GP 1 2 S ¡ • Replay ¡ ¡ GP GP – Track ¡state ¡using ¡GP-­‑BayesFilter ¡ z ¡ z ¡ – Use ¡control ¡given ¡by ¡control ¡GP ¡ z 1 z 2 • Track ¡contains ¡banked ¡curves, ¡eleva1on ¡changes ¡ • Custom ¡IMU ¡with ¡gyro ¡and ¡accelerometer ¡built ¡by ¡Intel ¡Research ¡Seakle ¡ Observa1ons ¡very ¡noisy, ¡perceptual ¡aliasing ¡ • Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 23 ¡ Amazon ¡ Dieter ¡Fox: ¡GP-­‑BayesFilters ¡ 24 ¡ 6

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend