Collaborative Evolutionary Reinforcement Learning Shauharda Khadka, - - PowerPoint PPT Presentation

▶

Nov 25, 2022 564 likes •716 views

Collaborative Evolutionary Reinforcement Learning Shauharda Khadka, Somdeb Majumdar, Tarek Nassar, Zach Dwiel, Evren Tumer, Santiago Miret, Yinyin Liu, Kagan Tumer* Artificial Intelligence Products Group, Intel Corporation Oregon State

SLIDE 1

Collaborative Evolutionary Reinforcement Learning

Shauharda Khadka, Somdeb Majumdar, Tarek Nassar, Zach Dwiel, Evren Tumer, Santiago Miret, Yinyin Liu, Kagan Tumer* Artificial Intelligence Products Group, Intel Corporation Oregon State University*

SLIDE 2

A simple actor-critic policy gradient setup

SLIDE 3

Learner

SLIDE 4

What do we optimize exactly?

SLIDE 5

Learner

SLIDE 6

Portfolio of Learners (varying discount rates)

SLIDE 7

Why varying discount rates?

SLIDE 8

Why varying discount rates?

SLIDE 9

Back to Portfolio of Learners

SLIDE 10

Adding a Resource Manager

SLIDE 11

Adding Neuroevolution

SLIDE 12

Experiment: Humanoid

SLIDE 13

Experiment: Humanoid

Solves Humanoid under 1 million samples
TD3 learners fail entirely
Neuroevolution ~62.5 million samples

SLIDE 14