Deep Imitation Learning with Virtual Reality for Robot Manipulation - PowerPoint PPT Presentation

MIN Faculty Department of Informatics Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks University of Hamburg Faculty of Mathematics, Informatics and Natural Sciences Department of Informatics Intelligent Robotics Moath Qasim 11.11.2019 Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 1

Outline Motivation Imitation Learning Demonstrations Learning Experiments Conclusion 1. Motivation 2. Imitation Learning 3. Demonstrations 4. Learning 5. Experiments 6. Conclusion Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 2

Motivation Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Goal Acquiring robotic manipulation skills in real world environment through learning neural network policies by using Deep Imitation Learning Challenges Imitation Learning is an e ff ective approach for skills acquisition, however: Obtaining high-quality demonstration is di ffi cult Complex kinesthetic teaching and trajectory optimisation Expensive tele-operation system Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 3

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Definition Imitation learning is a class of methods for acquiring skills by observing demonstrations A robot observe a human instructor performing a task and imitating it when needed. It is also referred to deep imitation learning as programming by demonstration Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 4

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Main Focus Imitation learning focuses mainly on three issues: E ffi cient motor learning The connection between action and perception Modular motor control in form of movement primitives Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 5

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Presenting Imitation Learning In order to describe a learning process as imitation learning 1. The imitated behaviour is new for the imitator 2. The same task strategy as that of the demonstrator is employed 3. The same task goal is accomplished Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 6

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Viewpoint of Neuroscience A connection between the sensory systems and the motor systems is essential Some neurones were active both when: a) The monkey observed a specific behaviour b) When it executed it itself Those particular neurones are called “Mirror Neurones” Fig. 1 Fig. 1: https://www.cell.com/cms/attachment/d4ed4e90-982d-4afe-9118-00609928eaf3/gr2.jpg Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 7

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Viewpoint of Robotics and AI How imitation learning was approached and represented? Symbolic Approaches to Imitation Learning Inductive Approaches to Imitation Learning Imitation Learning of Novel Behaviours Implications for Computational Models of Imitation Learning Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 8

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Imitation learning system Fig. 2 Fig. 2: https://www.researchgate.net/figure/Conceptual-sketch-of-an-imitation-learning-system-The-right-side-of-the- figure-contains_fig3_24379198 Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 9

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Examples Fig. 3: Autonomous Fig. 4: Autonomous helicopter flight driving Fig. 4: Gesturing and manipulation Fig. 3: https://www.iitk.ac.in/aero/images/dept-images/heli_small.jpg Fig. 4: https://ai4sig.org/2018/08/carla-imitation-learning-training/ Fig. 5: https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcSkwIA- wjMhe7vGiTPS8tEJt-D1uc41v2o3-X2I31SJFuDUXmpPtQ&s Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 10

Imitation Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Imitation learning Related Work Behavioural cloning Which performs supervised learning from observations to actions Inverse reinforcement learning Where a reward function is estimated to explain the demonstrations as (near) optimal behaviour Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 11

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Collecting Demonstrations Kinesthetic teaching In this method, the teacher physically manoeuvres the robot. https://www.youtube.com/watch?v=SCy4hdP-IeY Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 12

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Collecting Demonstrations Cont. Teleoperation This method is performed with the help of haptic device. https://www.youtube.com/watch?v=YLEUBFu5qgI Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 13

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Collecting Demonstrations Cont. Teleoperation with Virtual Reality This mode is also performed with the help of haptic device in addition to VR Headset https://www.youtube.com/watch?v=Bae0rvgySBg Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 14

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion VR Teleoperation Virtual Reality teleoperation allows: Direct mapping of observations and actions between the teacher and the robot Leveraging the natural manipulation instincts that the human teacher possesses Eliminating the possibility of hidden information for both parties Preventing any visual distractions from entering the environment Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 15

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion VR Teleoperation Models SensorGlove Microsoft Kinect Version 2 Oculus Rift Development Kit 2 The Humanoid Robot iCub Fig. 5: Control Architecture Fig. 5: https://www.semanticscholar.org/paper/First-person-tele-operation-of-a-humanoid-robot-Fritsche-Unverzag/ 47a9dedab44f2c7f1b7da16d24ae05bc2630723d Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 16

Demonstrations Motivation Imitation Learning Demonstrations Learning Experiments Conclusion VR Teleoperation Models Cont. Primesense Carmine 3D Cam Vive VR system PR2 robot Vive hand controllers Fig. 6: Control Architecture Fig. 6: https://techxplore.com/news/2017-11-startup-robots-puppets.html Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 17

Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Behavioural Cloning “Performs supervised learning from observations to actions” Deploying behavioural cloning algorithm to learn neural network control policies Collecting and presenting a data set which consist of: 1. Observation 2. Corresponding controls (i) (i) D task = {(o t , u t )} π (u t |o t ) θ Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 18

Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Neural Network Control Policies t o =(I ,D ,p ) t t t − 4 : t as an input 160 × 120 × 3 I : current RGB image I ∈ R 160 × 120 D : current depth image D t ∈ R 45 p : three points on the end effector p ∈ R t − 4 : t t − 4 : t Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 19

Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Neural Network Control Policies Cont. u = π (o ) t θ t as an output ω : angular velocity ω ∈ R 3 t 3 v ∈ R v: linear velocity t g ∈ {0, 1} g: desired gripper t Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 20

Learning Motivation Imitation Learning Demonstrations Learning Experiments Conclusion Neural Network Architecture The neural network architecture can be decomposed into three modules: θ = ( θ vision , θ aux , θ control ) f = CNN(I ,D ; θ vision ) t t t s = NN(f ; θ aux ) t t u = NN(p ,f ,s ; θ control ) t t t t − 4 : t Moath Qasim - Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks 21

Deep Imitation Learning with Virtual Reality for Robot Manipulation - PowerPoint PPT Presentation

MIN Faculty Department of Informatics Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks University of Hamburg Faculty of Mathematics, Informatics and Natural Sciences Department of Informatics Intelligent Robotics Moath

Why do imitation and analogy fail? Why do imitation and analogy fail? Imitation Imitation

Virtual Reality & Interaction Virtual Reality Virtual Reality Input Devices Input Devices

EXPERIENCE VIRTUAL REALITY VIRTUAL REALITY MARKET VR will be bigger than TV Virtual

Spatial Illusions: From Mirrors to Virtual Reality David Chalmers Virtual Reality Virtual

Robothlon Team competition, each team programs a robot for each event Events Robot

Imitation Learning Initial Concept and Approaches Nguyen, Thi Linh Chi Outline Motivation

A C A D E M I C S VIRTUAL REALITY IN EDUCATION VIRTUAL REALITY CONCEPTS 0 3 What is virtual

Virtual Reality Game Design Computer Graphics Seminar MTAT.03.305 Raimond Tunnel Virtual

Learning to Optimize as Policy Learning Yisong Yue Policy Learning (Reinforcement &

(Deep) Learning for Robot Perception and Navigation Wolfram Burgard Deep Learning for Robot

FAIC Foreign Accent Imitation Corpus Sara Neuhauser University of Jena, Germany IAFPA 2011

Imitation Theory and Experimental Evidence Joerg Oechssler University of Heidelberg

Imitation as a Stepping Stone to Innovation Amy Jocelyn Glass Texas A&M University Shift

Kevin Warwick Coventry University T urings Imitation Game T urings Imitation Game Kevin

Rockem Reality Rockem Reality | Punch Detection Method Hand Acceleration Measurement

What You Wanted to Know About Virtual Reality Diego Rivera-Gutierrez and Stevie Carnell Virtual

Deep Topology Classifica0on: A New Approach for Massive Graph Classifica0on Stephen Bonner, John

Master Recherche IAC Apprentissage Statistique, Optimisation & Applications Anne Auger

Introduction to Deep Learning Principles and applications in vision and natural language

Auditory System & Hearing Chapters 9 part II Lecture 16 Jonathan Pillow Sensation &

Inter Spike Intervals probability distribution and Double Integral Processes Olivier Faugeras

Deep Dive on RNNs Charles Martin What is an Artificial Neurone? Source - Wikimedia Commons

and Machine Learning Techniques Authors: A. Murari, R.Rossi, M.Lungaroni, P.Gaudio, and M. Gelfusa

Summary Semiotics Perception Data Jrg Cassens Representation Presentation References Data

Deep Imitation Learning with Virtual Reality for Robot Manipulation - PowerPoint PPT Presentation

MIN Faculty Department of Informatics Deep Imitation Learning with Virtual Reality for Robot Manipulation Tasks University of Hamburg Faculty of Mathematics, Informatics and Natural Sciences Department of Informatics Intelligent Robotics Moath

Why do imitation and analogy fail? Why do imitation and analogy fail? Imitation Imitation

Virtual Reality &amp; Interaction Virtual Reality Virtual Reality Input Devices Input Devices

EXPERIENCE VIRTUAL REALITY VIRTUAL REALITY MARKET VR will be bigger than TV Virtual

Spatial Illusions: From Mirrors to Virtual Reality David Chalmers Virtual Reality Virtual

Robothlon Team competition, each team programs a robot for each event Events Robot

Imitation Learning Initial Concept and Approaches Nguyen, Thi Linh Chi Outline Motivation

A C A D E M I C S VIRTUAL REALITY IN EDUCATION VIRTUAL REALITY CONCEPTS 0 3 What is virtual

Virtual Reality Game Design Computer Graphics Seminar MTAT.03.305 Raimond Tunnel Virtual

Learning to Optimize as Policy Learning Yisong Yue Policy Learning (Reinforcement &amp;

(Deep) Learning for Robot Perception and Navigation Wolfram Burgard Deep Learning for Robot

FAIC Foreign Accent Imitation Corpus Sara Neuhauser University of Jena, Germany IAFPA 2011

Imitation Theory and Experimental Evidence Joerg Oechssler University of Heidelberg

Imitation as a Stepping Stone to Innovation Amy Jocelyn Glass Texas A&amp;M University Shift

Kevin Warwick Coventry University T urings Imitation Game T urings Imitation Game Kevin

Rockem Reality Rockem Reality | Punch Detection Method Hand Acceleration Measurement

What You Wanted to Know About Virtual Reality Diego Rivera-Gutierrez and Stevie Carnell Virtual

Deep Topology Classifica0on: A New Approach for Massive Graph Classifica0on Stephen Bonner, John

Master Recherche IAC Apprentissage Statistique, Optimisation &amp; Applications Anne Auger

Introduction to Deep Learning Principles and applications in vision and natural language

Auditory System &amp; Hearing Chapters 9 part II Lecture 16 Jonathan Pillow Sensation &amp;

Inter Spike Intervals probability distribution and Double Integral Processes Olivier Faugeras

Deep Dive on RNNs Charles Martin What is an Artificial Neurone? Source - Wikimedia Commons

and Machine Learning Techniques Authors: A. Murari, R.Rossi, M.Lungaroni, P.Gaudio, and M. Gelfusa

Summary Semiotics Perception Data Jrg Cassens Representation Presentation References Data

Virtual Reality & Interaction Virtual Reality Virtual Reality Input Devices Input Devices

Learning to Optimize as Policy Learning Yisong Yue Policy Learning (Reinforcement &

Imitation as a Stepping Stone to Innovation Amy Jocelyn Glass Texas A&M University Shift

Master Recherche IAC Apprentissage Statistique, Optimisation & Applications Anne Auger

Auditory System & Hearing Chapters 9 part II Lecture 16 Jonathan Pillow Sensation &