Learning Dynamic Manipulation Skills under Unknown Dynamics with - - PowerPoint PPT Presentation

▶

Sep 02, 2023 25 likes •212 views

Learning Dynamic Manipulation Skills under Unknown Dynamics with Guided Policy Search Sergey Levine Pieter Abbeel UC Berkeley UC Berkeley Team TROOPER: Lockheed Martin, University of Pennsylvania, Philipp Krahenbuhl, Stanford University

SLIDE 1

Learning Dynamic Manipulation Skills under Unknown Dynamics with Guided Policy Search

Sergey Levine

UC Berkeley

Pieter Abbeel

UC Berkeley

SLIDE 2

Team TROOPER: Lockheed Martin, University of Pennsylvania, Rensselaer Polytechnic Institute Philipp Krahenbuhl, Stanford University

SLIDE 3

general-purpose neural network controller +

SLIDE 4

supervised learning trajectory optimization

policy search (RL) supervised learning trajectory optimization complex dynamics complex policy complex dynamics complex policy complex dynamics complex policy HARD EASY EASY

SLIDE 5

prob

guided policy search

Trajectory Optimization

SLIDE 6

approximate solution using iterative LQR (similar to extended Kalman filter)

locally linear dynamics
locally quadratic cost
Gaussian distribution

Trajectory Optimization

SLIDE 7

Trajectory Optimization

SLIDE 8

new

Trajectory Optimization

SLIDE 9

SLIDE 10

Trajectory Optimization

SLIDE 11

SLIDE 12

Trajectory Optimization

SLIDE 13

Trajectory Optimization

SLIDE 14

Guided Policy Search

see Levine & Koltun, ICML 2014

SLIDE 15

SLIDE 16

SLIDE 17

SLIDE 18

Concluding Comments

simple linear dynamics model
fast, simple, standard LQR solver
can handle contacts despite linear

model

fit very complex policies with guided