ANR ExTra-Learn
Extraction and Transfer of Knowledge in Reinforcement Learning
- A. LAZARIC
ANR Réunion de lancement projets, Paris
SequeL
INRIA Lille – Nord Europe
November 4th, 2014
Consortium ANR Jeunes Chercheurs Jeunes Chercheuses Programme - - PowerPoint PPT Presentation
ANR ExTra-Learn Extraction and Transfer of Knowledge in Reinforcement Learning A. LAZARIC ANR Runion de lancement projets, Paris SequeL INRIA Lille Nord Europe November 4th, 2014 Consortium ANR Jeunes Chercheurs Jeunes
ANR Réunion de lancement projets, Paris
SequeL
INRIA Lille – Nord Europe
November 4th, 2014
November 4th, 2014
INRIA ¡Lille ¡– ¡Nord ¡Europe ¡ SequeL ¡Team ¡
PhD ¡ Student ¡ Post-‑doc ¡ (2yrs) ¡
(CR1) ¡
(MdC) ¡
(CR1) ¡
(DR1) ¡
ANR ¡“Jeunes ¡Chercheurs ¡Jeunes ¡Chercheuses” ¡Programme ¡
November 4th, 2014
Critic
acJon ¡
reward ¡
November 4th, 2014
Environment ¡ CriJc ¡
Learning ¡ Agent ¡
acJon ¡
reward ¡
November 4th, 2014
Task ¡
Agent ¡
CriEc ¡
acEon ¡
reward ¡
prior ¡ knowledge ¡ designer ¡
November 4th, 2014
Task ¡n+1 ¡
Agent ¡
CriEc ¡
acEon ¡
reward ¡
Transfer ¡ transferred ¡ knowledge ¡ past ¡ knowledge ¡
Task ¡1 ¡ Task ¡n ¡
November 4th, 2014
(2014-‑2017) ¡
Objec7ve ¡1 ¡ Objec7ve ¡2 ¡ Objec7ve ¡3 ¡
November 4th, 2014
Reduce ¡sample ¡ complexity ¡ Improve ¡accuracy ¡ Solve ¡problems ¡with ¡ complex ¡structure ¡
Objec7ve ¡1 ¡ Objec7ve ¡2 ¡ Objec7ve ¡3 ¡
Task ¡1 ¡ Transfer ¡of ¡ExploraJon-‑ ExploitaJon ¡Strategies ¡ Task ¡2 ¡ Transfer ¡SoluJons ¡for ¡ Approximated ¡RL ¡ Task ¡3 ¡ Hierarchical ¡ ¡ Transfer ¡RL ¡
November 4th, 2014
Reduce ¡sample ¡ complexity ¡
Objec7ve ¡1 ¡
Task ¡1 ¡ Transfer ¡of ¡ExploraJon-‑ ExploitaJon ¡Strategies ¡
Algorithms ¡with ¡ provable ¡smaller ¡regret ¡
Improve ¡accuracy ¡
Objec7ve ¡2 ¡
Task ¡2 ¡ Transfer ¡SoluJons ¡for ¡ Approximated ¡RL ¡
Algorithms ¡with ¡ provable ¡smaller ¡ predicJon ¡error ¡
Solve ¡problems ¡with ¡ complex ¡structure ¡
Objec7ve ¡3 ¡
Task ¡3 ¡ Hierarchical ¡ ¡ Transfer ¡RL ¡
Models ¡and ¡algorithms ¡ for ¡automaJc ¡ hierarchical ¡ decomposiJon ¡
November 4th, 2014
Reduce ¡sample ¡ complexity ¡
Objec7ve ¡1 ¡
Task ¡1 ¡ Transfer ¡of ¡ExploraJon-‑ ExploitaJon ¡Strategies ¡ Algorithms ¡with ¡provable ¡ smaller ¡regret ¡ Improve ¡accuracy ¡
Objec7ve ¡2 ¡
Task ¡2 ¡ Transfer ¡SoluJons ¡for ¡ Approximated ¡RL ¡
Algorithms ¡with ¡provable ¡ smaller ¡predicJon ¡error ¡ Solve ¡problems ¡with ¡ complex ¡structure ¡
Objec7ve ¡3 ¡
Task ¡3 ¡ Hierarchical ¡ ¡ Transfer ¡RL ¡ Models ¡and ¡algorithms ¡ for ¡automaJc ¡hierarchical ¡ decomposiJon ¡
https://project.inria.fr/ExTra-Learn/ (under construction)
Agence Nationale de Recherche (ANR) Paris