Dumb Imita*on Is there a type of learning which is - - PowerPoint PPT Presentation

dumb imita on
SMART_READER_LITE
LIVE PREVIEW

Dumb Imita*on Is there a type of learning which is - - PowerPoint PPT Presentation

Dumb Imita*on Is there a type of learning which is evolu*onarily mo*vated, and which is not reinforcement learning? Evolu*onary mo*va*on This is a


slide-1
SLIDE 1

Dumb ¡Imita*on ¡

Is ¡there ¡a ¡type ¡of ¡learning ¡which ¡is ¡ evolu*onarily ¡mo*vated, ¡and ¡which ¡ is ¡not ¡reinforcement ¡learning? ¡ ¡

slide-2
SLIDE 2

Evolu*onary ¡mo*va*on ¡

This ¡is ¡a ¡theore&cal ¡argument ¡about ¡the ¡possible ¡ evolu&onary ¡role ¡of ¡a ¡simple ¡type ¡of ¡imita*on ¡

  • learning. ¡ ¡ ¡

¡ I ¡am ¡not ¡going ¡to ¡consider ¡how ¡imita*on ¡is ¡ cogni*vely ¡achieved: ¡it ¡could ¡be ¡by ¡ sophis*cated ¡cogni*ve ¡mechanisms, ¡or ¡ something ¡as ¡simple ¡as ¡taking ¡a ¡rest ¡at ¡the ¡same ¡ *me ¡of ¡day, ¡or ¡travelling ¡at ¡the ¡same ¡speed. ¡ ¡

slide-3
SLIDE 3

Imita*on ¡can ¡be ¡adap*ve ¡for ¡several ¡ reasons: ¡these ¡will ¡not ¡be ¡considered ¡

Amor&za&on ¡of ¡explora&on ¡and ¡trial-­‑and-­‑error ¡

Adap*ve ¡to ¡imitate ¡those ¡who ¡have ¡found ¡the ¡food, ¡or ¡ acquired ¡useful ¡skills ¡by ¡trial ¡and ¡error. ¡ ¡

Amor&za&on ¡of ¡selec&on ¡

Adap*ve ¡to ¡imitate ¡behaviour ¡of ¡those ¡who ¡have ¡ survived ¡selec*on: ¡behave ¡like ¡a ¡survivor. ¡

Imita&on ¡of ¡parents ¡as ¡cogni&ve ¡development ¡ Transmission ¡of ¡culture ¡from ¡one ¡genera&on ¡to ¡the ¡ next ¡

Inter-­‑genera*onal ¡amor*za*on ¡of ¡trial-­‑and-­‑error ¡

  • learning. ¡ ¡

¡ ¡ ¡

slide-4
SLIDE 4

Dumb ¡imita*on ¡of ¡peers ¡

¡

– An ¡animal ¡par&ally ¡imitates ¡the ¡behaviour ¡of ¡a ¡ sample ¡of ¡its ¡peers. ¡ ¡ – It ¡does ¡not ¡iden*fy ¡which ¡behaviours ¡are ¡ adap*ve ¡ ¡ – It ¡does ¡not ¡iden*fy ¡which ¡individuals ¡are ¡fiFer: ¡it ¡ imitates ¡the ¡behaviour ¡of ¡fit ¡and ¡unfit ¡alike. ¡

slide-5
SLIDE 5

A ¡hypothe*cal ¡species: ¡summerpodes ¡

(A ¡bit ¡like ¡the ¡Megapodes ¡…) ¡ ¡ Four ¡stage ¡life ¡cycle: ¡ ¡ ¡

  • 1. Egg-­‑stage ¡
  • 2. Observa*on-­‑stage ¡
  • 3. Learning-­‑stage ¡
  • 4. Selec*on-­‑stage ¡
slide-6
SLIDE 6

Summerpode ¡life-­‑cycle: ¡egg ¡stage ¡

  • 1. Egg-­‑stage ¡

Eggs ¡are ¡laid ¡in ¡autumn ¡and ¡hatch ¡in ¡the ¡spring. ¡ ¡ ¡ Parents ¡die ¡when ¡eggs ¡are ¡laid, ¡so ¡next ¡genera*on ¡never ¡ meet ¡previous ¡genera*on, ¡hence ¡no ¡cultural ¡

  • transmission. ¡ ¡Each ¡genera*on ¡only ¡meet ¡each ¡other. ¡

¡ The ¡only ¡informa*on ¡transmiFed ¡from ¡parents ¡to ¡ children ¡is ¡gene'c. ¡ ¡

  • 2. Observa*on-­‑stage ¡
  • 3. Learning-­‑stage ¡
  • 4. Selec*on-­‑stage ¡
slide-7
SLIDE 7

Summerpodes: ¡observa*on ¡stage ¡

  • 1. Egg-­‑stage ¡
  • 2. Observa*on-­‑stage ¡

AUer ¡hatching, ¡summerpodes ¡gather ¡in ¡groups ¡of ¡ unrelated ¡individuals. ¡ ¡ Each ¡individual’s ¡ ¡behaviour ¡is ¡innate. ¡ The ¡summerpode ¡hatchlings ¡observe ¡each ¡other’s ¡ behaviours, ¡without ¡learning. ¡ ¡ There ¡is ¡no ¡selec*on ¡at ¡this ¡stage: ¡all ¡individuals ¡survive. ¡

  • 3. Learning-­‑stage ¡
  • 4. Selec*on-­‑stage ¡
slide-8
SLIDE 8

Summerpodes: ¡learning ¡stage ¡

  • 1. Egg ¡stage ¡
  • 2. Observa*on ¡stage ¡
  • 3. Learning ¡stage ¡

At ¡the ¡end ¡of ¡the ¡observa*on ¡stage, ¡the ¡summerpodes ¡ go ¡to ¡sleep; ¡while ¡asleep, ¡learning ¡occurs ¡using ¡their ¡

  • bserva*ons. ¡ ¡ ¡

Each ¡summerpode ¡adjusts ¡its ¡innate ¡behaviour ¡to ¡be ¡ more ¡similar ¡to ¡the ¡the ¡behaviour ¡of ¡its ¡peers. ¡ ¡ When ¡the ¡summerpodes ¡wake ¡up, ¡learning ¡is ¡complete, ¡ and ¡their ¡behaviour ¡is ¡now ¡fixed ¡for ¡the ¡rest ¡of ¡their ¡life. ¡ ¡

  • 4. Selec*on ¡stage ¡
slide-9
SLIDE 9

Summerpodes: ¡selec*on ¡stage ¡

  • 1. Egg ¡stage ¡
  • 2. Observa*on ¡stage ¡
  • 3. Learning ¡stage ¡
  • 4. Selec*on ¡stage ¡

The ¡summerpodes ¡compete ¡to ¡feed, ¡mate, ¡lay ¡eggs ¡etc. ¡ ¡ ¡ ¡ Reproduc've ¡success ¡depends ¡on ¡the ¡behaviour ¡fixed ¡ in ¡the ¡learning ¡stage, ¡not ¡on ¡the ¡original ¡innate ¡ behaviour ¡ Summerpodes ¡die ¡at ¡the ¡end ¡of ¡this ¡stage. ¡ ¡

slide-10
SLIDE 10

Summerpodes: ¡points ¡to ¡note ¡

  • The ¡only ¡learning ¡is ¡imita*on ¡of ¡innate ¡

behaviour ¡of ¡peers ¡in ¡the ¡same ¡genera*on; ¡ there ¡is ¡no ¡learning ¡from ¡experience ¡

  • During ¡observa*on ¡and ¡learning, ¡the ¡

summerpodes ¡cannot ¡dis*nguish ¡which ¡ behaviours ¡are ¡adap*ve, ¡nor ¡can ¡they ¡tell ¡ which ¡individuals ¡will ¡be ¡fit ¡

  • In ¡this ¡sense, ¡summerpode ¡learning ¡is ¡ ¡

“dumb ¡imita*on ¡of ¡peers” ¡

slide-11
SLIDE 11

Summerpode ¡gene*cs ¡and ¡evolu*on ¡

Phenotype ¡(learned ¡behaviour) ¡is ¡abstracted ¡as ¡a ¡ vector ¡of ¡N ¡real ¡numbers. ¡ ¡ ¡ Genotype ¡is ¡a ¡vector ¡of ¡N ¡real ¡numbers. ¡ ¡ ¡ Breeding: ¡child ¡genotype ¡c ¡is ¡recombina*on ¡of ¡ parental ¡genotypes, ¡plus ¡Gaussian ¡noise. ¡ ¡ ¡ Selec*on: ¡fitness ¡decreases ¡with ¡distance ¡of ¡ phenotype ¡from ¡ideal ¡target ¡phenotype ¡t. ¡

slide-12
SLIDE 12

Summerpode ¡learning ¡

Each ¡summerpode ¡observes ¡the ¡innate ¡ behaviour ¡of ¡k ¡randomly ¡selected ¡individuals. ¡ ¡ “Observing ¡innate ¡behaviour” ¡is ¡abstracted ¡as ¡

  • bserving ¡k ¡genotypes ¡ ¡ ¡ ¡ ¡ ¡ ¡… ¡ ¡

Each ¡summerpode ¡computes ¡average ¡of ¡k ¡ genomes ¡it ¡observes, ¡and ¡adjusts ¡its ¡own ¡innate ¡ behaviour ¡towards ¡this ¡average. ¡ ¡ ¡

g1

gk

p = (1− λ)g+ λ g1 ++ gk k

slide-13
SLIDE 13

A ¡popula*on ¡of ¡2-­‑dimensional ¡summerpodes: ¡blue ¡dots ¡represent ¡

  • genotypes. ¡Yellow ¡dot ¡is ¡one ¡genome ¡for ¡which ¡learning ¡will ¡be ¡
  • diagrammed. ¡ ¡

The ¡target ¡value ¡(fiFest ¡possible ¡phenotype) ¡is ¡shown ¡by ¡a ¡magenta ¡

  • cross. ¡ ¡
slide-14
SLIDE 14

The ¡yellow ¡summerpode ¡observes ¡a ¡sample ¡of ¡10 ¡others, ¡and ¡computes ¡their ¡ average, ¡as ¡the ¡cyan ¡dot. ¡Each ¡summerpode ¡in ¡the ¡sample ¡of ¡10 ¡is ¡connected ¡to ¡ the ¡average ¡with ¡a ¡magenta ¡line. ¡ ¡ Learned ¡ ¡ Phenotype, ¡a ¡ linear ¡ combina*on ¡of ¡ the ¡genotype ¡ and ¡the ¡ average ¡of ¡the ¡

  • bserva*ons ¡

The ¡black ¡dot ¡(indicated ¡by ¡an ¡arrow) ¡on ¡the ¡line ¡between ¡the ¡observer ¡(yellow) ¡ and ¡the ¡mean ¡of ¡the ¡observa*ons ¡(cyan) ¡is ¡the ¡new ¡learned ¡phenotype ¡for ¡the ¡ yellow ¡individual. ¡ ¡

slide-15
SLIDE 15

In ¡this ¡diagram, ¡all ¡the ¡learned ¡phenotypes ¡are ¡shown ¡as ¡black ¡dots. ¡ ¡ Note ¡that ¡these ¡are ¡generally ¡closer ¡to ¡the ¡target ¡than ¡the ¡genotypes. ¡ ¡

slide-16
SLIDE 16

Summerpodes ¡are ¡now ¡selected ¡according ¡to ¡their ¡learned ¡phenotypes. ¡ ¡ The ¡50% ¡of ¡individuals ¡with ¡learned ¡phenotypes ¡closest ¡to ¡the ¡target ¡are ¡

  • selected. ¡ ¡
slide-17
SLIDE 17

This ¡diagram ¡shows ¡as ¡red ¡dots ¡the ¡genotypes ¡corresponding ¡to ¡the ¡selected ¡

  • phenotypes. ¡ ¡It ¡is ¡these ¡red ¡genotypes ¡that ¡will ¡be ¡used ¡to ¡breed ¡the ¡next ¡

genera*on. ¡ ¡

slide-18
SLIDE 18
slide-19
SLIDE 19

Remarks ¡on ¡the ¡summerpode ¡model ¡

  • Model ¡has ¡been ¡greatly ¡simplified ¡to ¡eliminate ¡other ¡

forms ¡of ¡imita*ve ¡learning, ¡and ¡use ¡dumb ¡imita*on ¡

  • nly. ¡ ¡
  • Dumb ¡imita*on ¡might ¡combine ¡posi*vely ¡with ¡other ¡

types ¡of ¡“smart” ¡imita*on. ¡ ¡

  • Simultaneous ¡observa*on ¡and ¡learning ¡would ¡be ¡a ¡

more ¡realis*c ¡assump*on, ¡and ¡would ¡lead ¡to ¡a ¡more ¡ complicated ¡learning ¡equilibrium, ¡in ¡which ¡the ¡ effec*ve ¡value ¡of ¡k ¡would ¡be ¡increased. ¡

  • Relatedness ¡effects ¡and ¡non-­‑uniform ¡mixing ¡during ¡
  • bserva*on ¡would ¡reduce ¡the ¡effec*ve ¡value ¡of ¡k. ¡ ¡
slide-20
SLIDE 20

Popula*on-­‑level ¡informa*on ¡flow ¡

With ¡dumb ¡mutual ¡imita*on ¡of ¡innate ¡behaviour, ¡less ¡ selec*on ¡gives ¡more ¡precisely ¡adapted ¡behaviour ¡than ¡ with ¡innate ¡behaviour ¡alone. ¡ ¡ Yet ¡the ¡imita*on ¡is ¡“dumb” ¡in ¡the ¡sense ¡that ¡imita*on ¡ takes ¡no ¡account ¡of ¡fitness. ¡ ¡ ¡ So ¡where ¡is ¡the ¡extra ¡informa*on ¡coming ¡from ¡?! ¡ ¡ Answer: ¡evolu'on ¡is ¡happening ¡at ¡the ¡popula'on ¡level. ¡ The ¡popula*on ¡as ¡a ¡whole ¡contains ¡more ¡adap*ve ¡ informa*on ¡than ¡a ¡single ¡individual: ¡imita*on ¡allows ¡ individuals ¡to ¡access ¡this ¡popula*on-­‑level ¡informa*on. ¡

slide-21
SLIDE 21

Conclusions ¡on ¡Dumb ¡Imita*on ¡

  • 1. Dumb ¡imita*on ¡can ¡enable ¡an ¡individual ¡to ¡

access ¡some ¡types ¡of ¡gene*c ¡informa*on ¡across ¡ the ¡popula*on ¡by ¡copying ¡innate ¡behaviour ¡

  • 2. Equilibrium ¡aUer ¡learning ¡can ¡give ¡more ¡

precisely ¡adapted ¡behaviour ¡with ¡less ¡intense ¡ selec*on ¡

  • 3. Difficult ¡to ¡disentangle ¡dumb ¡imita*on ¡from ¡

smart ¡imita*on ¡experimentally…. ¡

  • 4. ….but ¡dumb ¡imita*on ¡could ¡be ¡ubiquitous ¡in ¡

social ¡species? ¡

slide-22
SLIDE 22

Reflec*on ¡

Evolu*on ¡is ¡barely ¡studied ¡within ¡machine ¡learning, ¡ and ¡yet ¡evolu*on ¡is ¡a ¡robust ¡adap*ve ¡process ¡– ¡a ¡ kind ¡of ¡reinforcement ¡learning ¡– ¡that ¡has ¡ developed ¡chemical, ¡mechanical, ¡anatomical, ¡and ¡ behavioural ¡solu*ons ¡to ¡the ¡challenges ¡of ¡survival. ¡ ¡ Two ¡abstract ¡models ¡that ¡relate ¡evolu*on ¡to ¡ learning ¡have ¡been ¡briefly ¡described. ¡ ¡ ¡ There ¡are ¡surely ¡many ¡more ¡to ¡find... ¡