Modeling Biological Processes for Reading Comprehension - - PowerPoint PPT Presentation

modeling biological processes for reading comprehension
SMART_READER_LITE
LIVE PREVIEW

Modeling Biological Processes for Reading Comprehension - - PowerPoint PPT Presentation

Modeling Biological Processes for Reading Comprehension Vivek Srikumar University of Utah (Previously, Stanford University) Jonathan Berant , Pei-Chun Chen,


slide-1
SLIDE 1

Modeling ¡Biological ¡Processes ¡for ¡ Reading ¡Comprehension ¡

Vivek ¡Srikumar ¡ University ¡of ¡Utah ¡(Previously, ¡Stanford ¡University) ¡ ¡

¡ Jonathan ¡Berant, ¡Pei-­‑Chun ¡Chen, ¡Abby ¡Vander ¡Linden, ¡ ¡ BriEany ¡Harding, ¡Brad ¡Huang, ¡Peter ¡Clark ¡and ¡Christopher ¡D. ¡Manning ¡ ¡

slide-2
SLIDE 2

¡Reading ¡comprehension ¡is ¡hard! ¡

What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡ Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡ protons ¡(hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑

  • product. ¡Light ¡absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡
  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡water ¡to ¡an ¡

acceptor ¡called ¡NADP+. ¡

slide-3
SLIDE 3

¡Reading ¡comprehension ¡is ¡hard! ¡

What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡ Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡ protons ¡(hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑

  • product. ¡Light ¡absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡
  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡water ¡to ¡an ¡

acceptor ¡called ¡NADP+. ¡

slide-4
SLIDE 4

¡Reading ¡comprehension ¡is ¡hard! ¡

What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡ Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡ protons ¡(hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑

  • product. ¡Light ¡absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡
  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡water ¡to ¡an ¡

acceptor ¡called ¡NADP+. ¡

slide-5
SLIDE 5

¡Reading ¡comprehension ¡is ¡hard! ¡

What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡ Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡ protons ¡(hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑

  • product. ¡Light ¡absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡
  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡water ¡to ¡an ¡

acceptor ¡called ¡NADP+. ¡ Enable ¡

slide-6
SLIDE 6

¡Reading ¡comprehension ¡is ¡hard! ¡

What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡ Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡ protons ¡(hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑

  • product. ¡Light ¡absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡
  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡water ¡to ¡an ¡

acceptor ¡called ¡NADP+. ¡ Enable ¡ Cause ¡

slide-7
SLIDE 7

ContribuNons ¡

  • 1. A ¡new ¡reading ¡comprehension ¡task ¡requiring ¡reasoning ¡
  • ver ¡processes ¡

¡ ¡Processes ¡are ¡fundamental ¡in ¡many ¡domains ¡

  • 2. A ¡new ¡dataset ¡ProcessBank ¡consisNng ¡of ¡

descripNons ¡of ¡biological ¡processes ¡with ¡

– Rich ¡process ¡structure ¡annotated, ¡and ¡ – MulNple-­‑choice ¡quesNons ¡

  • 3. A ¡new ¡end-­‑to-­‑end ¡system ¡for ¡reading ¡comprehension ¡

– Predict ¡structure ¡and ¡treat ¡it ¡as ¡a ¡knowledge ¡base ¡ – Parse ¡quesNon ¡as ¡query ¡to ¡this ¡KB ¡(semanNc ¡parsing) ¡

slide-8
SLIDE 8

A ¡new ¡dataset: ¡ProcessBank

slide-9
SLIDE 9

MoNvaNon: ¡macro ¡vs. ¡micro ¡reading ¡

  • Macro ¡reading: ¡

– Exploits ¡web-­‑scale ¡redundancy ¡

[Etzioni ¡et ¡al., ¡2006, ¡Carlson ¡et ¡al., ¡2010, ¡Fader ¡et ¡al., ¡2011] ¡

– Factoid ¡quesNons ¡

[Berant ¡el ¡al., ¡2014, ¡Fader ¡et ¡al., ¡2014] ¡

  • Micro ¡reading: ¡

– Single ¡document ¡ – Requires ¡reasoning ¡ ¡ – Non-­‑factoid ¡quesNons ¡

[Richardson ¡et ¡al., ¡2013, ¡Kushman ¡et ¡al., ¡2014] ¡

Chosen ¡domain: ¡ ¡ Biological ¡process ¡ descrip3ons ¡

slide-10
SLIDE 10

Processes ¡abound ¡in ¡biology ¡

Nitrogen ¡Cycle ¡

Tissue ¡Engineering ¡ Central ¡Dogma ¡of ¡Molecular ¡Biology ¡

slide-11
SLIDE 11

CreaNng ¡a ¡difficult ¡reading ¡ comprehension ¡task ¡

200 ¡paragraphs ¡from ¡the ¡textbook ¡Biology ¡

¡

Desiderata ¡

  • 1. Test ¡understanding ¡of ¡inter-­‑relaNons ¡between ¡

events ¡and ¡enNNes ¡

  • 2. Both ¡answers ¡should ¡have ¡similar ¡lexical ¡overlap: ¡
  • Trump ¡shallow ¡approaches ¡
  • Sidestep ¡lexical ¡variability ¡

Extending ¡[Scaria, ¡et ¡al. ¡2013] ¡ [Campbell ¡& ¡Reese, ¡2005] ¡

slide-12
SLIDE 12

Reading ¡comprehension ¡annotaNon ¡

  • AnnotaNon ¡instrucNons: ¡Ask ¡quesNons ¡about ¡events, ¡

enNNes ¡and ¡their ¡relaNonships ¡

– 10 ¡examples ¡provided ¡ – Two ¡answer ¡choices, ¡only ¡one ¡unambiguously ¡correct ¡

  • 200 ¡paragraphs ¡! ¡585 ¡quesNons ¡
  • Second ¡annotator ¡answered ¡the ¡quesNons ¡

– 98.1% ¡agreement ¡

slide-13
SLIDE 13

Examples ¡of ¡annotated ¡quesNons ¡

Dependencies ¡between ¡events/en33es ¡(70%) ¡ Q: ¡What ¡can ¡the ¡spli4ng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

¡

Temporal ¡ordering ¡of ¡events ¡(10%) ¡ Q: ¡What ¡is ¡the ¡correct ¡order ¡of ¡events? ¡ A: ¡PDGF ¡binds ¡to ¡tyrosine ¡kinases, ¡then ¡cells ¡divide, ¡then ¡wound ¡healing ¡ ¡ B: ¡Cells ¡divide, ¡then ¡PDGF ¡binds ¡to ¡tyrosine ¡kinases, ¡then ¡wound ¡healing ¡

¡

True-­‑False ¡ques3ons ¡(20%) ¡ Q: ¡Cdk ¡associates ¡with ¡MPF ¡to ¡become ¡cyclin ¡ A: ¡True ¡ B: ¡False ¡ ¡

slide-14
SLIDE 14

A ¡second ¡layer ¡of ¡annotaNon: ¡ Process ¡structures ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡protons ¡ (hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡of ¡the ¡electrons ¡and ¡ hydrogen ¡ions ¡from ¡water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡

slide-15
SLIDE 15

A ¡second ¡layer ¡of ¡annotaNon: ¡ Process ¡structures ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡protons ¡ (hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡of ¡the ¡electrons ¡and ¡ hydrogen ¡ions ¡from ¡water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡

split ¡ absorb ¡ transfer ¡ Triggers: ¡Tokens ¡ denoNng ¡occurrence ¡of ¡ an ¡event ¡

slide-16
SLIDE 16

A ¡second ¡layer ¡of ¡annotaNon: ¡ Process ¡structures ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡protons ¡ (hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡of ¡the ¡electrons ¡and ¡ hydrogen ¡ions ¡from ¡water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡

split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡ Theme ¡ Theme ¡ Theme ¡ Triggers: ¡Tokens ¡ denoNng ¡occurrence ¡of ¡ an ¡event ¡ Arguments: ¡Agent, ¡Theme, ¡ Source, ¡DesGnaGon, ¡ LocaGon, ¡Result ¡and ¡Other ¡

slide-17
SLIDE 17

A ¡second ¡layer ¡of ¡annotaNon: ¡ Process ¡structures ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡electrons ¡and ¡protons ¡ (hydrogen ¡ions, ¡H+) ¡and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡of ¡the ¡electrons ¡and ¡ hydrogen ¡ions ¡from ¡water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡

split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡ Theme ¡ Theme ¡ Theme ¡ Enable ¡ Cause ¡ Triggers: ¡Tokens ¡ denoNng ¡occurrence ¡of ¡ an ¡event ¡ Arguments: ¡Agent, ¡Theme, ¡ Source, ¡DesGnaGon, ¡ LocaGon, ¡Result ¡and ¡Other ¡ E-­‑E ¡rela3ons: ¡Cause, ¡Enable, ¡ Prevent, ¡Super, ¡Same ¡

slide-18
SLIDE 18

Process ¡structure ¡data ¡

  • Same ¡200 ¡paragraphs ¡from ¡Biology ¡

– Paragraphs ¡annotated ¡and ¡verified ¡ ¡

  • Three ¡annotators ¡ ¡

– Biologists ¡ – Independent ¡from ¡QA ¡annotator ¡

  • PotenNally ¡conflicNng ¡with ¡quesNons ¡
  • More ¡nuances ¡

– Eg: ¡No ¡temporal ¡ordering ¡of ¡events ¡

  • Contrast ¡with ¡[Scaria ¡et ¡al ¡2013] ¡
slide-19
SLIDE 19

What ¡is ¡ProcessBank? ¡

  • 200 ¡paragraphs ¡from ¡the ¡textbook ¡Biology ¡

– Manually ¡chosen ¡to ¡represent ¡biological ¡processes ¡

  • Each ¡paragraph ¡annotated ¡with ¡

– Non-­‑factoid ¡reading ¡comprehension ¡quesNons ¡ – Process ¡structures ¡ ¡ ¡ ¡

slide-20
SLIDE 20

Answering ¡ques3ons: ¡Overview ¡

slide-21
SLIDE 21

System ¡in ¡a ¡nutshell ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

slide-22
SLIDE 22

System ¡in ¡a ¡nutshell ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Step ¡1 ¡ Process ¡Structure ¡PredicNon ¡

slide-23
SLIDE 23

System ¡in ¡a ¡nutshell ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Step ¡1 ¡ Step ¡2 ¡ Process ¡Structure ¡PredicNon ¡ QuesNon ¡Parsing ¡

slide-24
SLIDE 24

System ¡in ¡a ¡nutshell ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Step ¡1 ¡ Step ¡2 ¡ Step ¡3: ¡Answer ¡= ¡B ¡ Process ¡Structure ¡PredicNon ¡ QuesNon ¡Parsing ¡ Answering ¡QuesNon ¡

slide-25
SLIDE 25

Predic3ng ¡process ¡structures ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡

Step ¡1 ¡

slide-26
SLIDE 26

Process ¡structure ¡predicNon ¡

¡

  • 1. Train ¡trigger ¡idenNfier ¡
  • 2. Joint ¡learning ¡and ¡inference ¡over ¡arguments ¡and ¡event-­‑

event ¡relaNons ¡using ¡predicted ¡triggers ¡

¡ ¡

LogisNc ¡regression; ¡features ¡from ¡words, ¡lists ¡

Joint ¡inference ¡over ¡(1) ¡and ¡(2) ¡increases ¡runNme ¡

… ¡without ¡noNceable ¡performance ¡gains ¡ Fast ¡feature ¡engineering ¡cycles ¡are ¡important! ¡

slide-27
SLIDE 27

Event-­‑arguments ¡and ¡event-­‑event ¡relaNons ¡

Total ¡event-­‑ argument ¡score ¡ ¡ Total ¡event-­‑event ¡relaNon ¡ score ¡

split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡ Theme ¡ Theme ¡ Theme ¡ Enable ¡ Cause ¡ [Roth ¡and ¡Yih, ¡2004, ¡Punyakanok ¡et ¡al. ¡2008, ¡etc] ¡

slide-28
SLIDE 28

Event-­‑arguments ¡and ¡event-­‑event ¡relaNons ¡

Total ¡event-­‑event ¡relaNon ¡ score ¡

Trigger ¡t ¡ Argument ¡candidate ¡a ¡ Argument ¡label ¡L ¡

Score ¡that ¡arg-­‑ candidate ¡has ¡ label ¡L ¡

split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡

Agent ¡ Theme ¡ Source ¡ …?? ¡ Agent ¡ Theme ¡ Source ¡ …?? ¡ Agent ¡ Theme ¡ Source ¡ …?? ¡

[Roth ¡and ¡Yih, ¡2004, ¡Punyakanok ¡et ¡al. ¡2008, ¡etc] ¡

slide-29
SLIDE 29

Event-­‑arguments ¡and ¡event-­‑event ¡relaNons ¡

Trigger ¡t ¡ Argument ¡candidate ¡a ¡ Argument ¡label ¡L ¡ split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡ Enable, ¡Prevent, ¡Same…? ¡ Enable, ¡Prevent, ¡Same…? ¡ Pair ¡of ¡events ¡(t1, ¡t2) ¡ ¡ ¡ RelaNon ¡label ¡R ¡

Score ¡that ¡trigger ¡pair ¡ connected ¡by ¡relaNon ¡R ¡

[Roth ¡and ¡Yih, ¡2004, ¡Punyakanok ¡et ¡al. ¡2008, ¡etc] ¡

Score ¡that ¡arg-­‑ candidate ¡has ¡ label ¡L ¡

slide-30
SLIDE 30

Joint ¡inference ¡with ¡constraints ¡

  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

And ¡a ¡few ¡other ¡constraints ¡

slide-31
SLIDE 31
  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

R ¡

Joint ¡inference ¡with ¡constraints ¡

Event ¡1 ¡ Event ¡2 ¡ EnNty ¡ Result ¡ Agent ¡

Not ¡allowed! ¡

And ¡a ¡few ¡other ¡constraints ¡

slide-32
SLIDE 32
  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

R ¡

Joint ¡inference ¡with ¡constraints ¡

Event ¡1 ¡ Event ¡2 ¡ EnNty ¡ Result ¡ Agent ¡ Enable ¡

And ¡a ¡few ¡other ¡constraints ¡

slide-33
SLIDE 33

Learning ¡and ¡Inference ¡

  • Linear ¡model ¡to ¡score ¡argument ¡labels ¡and ¡

event-­‑event ¡relaNons ¡

– Related: ¡SemanNc ¡role ¡labeling, ¡informaNon ¡ extracNon ¡ ¡

¡

  • Structured ¡averaged ¡perceptron ¡
  • Gurobi ¡ILP ¡solver ¡(exact ¡soluNon) ¡
slide-34
SLIDE 34

Answering ¡ques3ons ¡

slide-35
SLIDE 35

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Step ¡1 ¡ Step ¡2 ¡ QuesNon ¡Parsing ¡

Where ¡are ¡we? ¡

slide-36
SLIDE 36

QuesNon ¡parsing ¡

  • Task: ¡Given ¡a ¡quesNon ¡and ¡two ¡answers, ¡

produce ¡two ¡queries ¡ ¡

– One ¡for ¡each ¡answer ¡ ¡

  • Query ¡structure ¡

Source ¡ node ¡ Target ¡ node ¡ Regular ¡expression ¡ ¡

  • ver ¡labels ¡
slide-37
SLIDE 37

Parsing ¡quesNon ¡to ¡produce ¡formal ¡queries ¡

What ¡does ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Theme ¡ Theme ¡

split ¡ absorb ¡ water ¡ light ¡

(Enable|Super)+ ¡

split ¡ transfer ¡ water ¡ ions ¡

Theme ¡ Theme ¡ (Enable|Super)+ ¡

slide-38
SLIDE 38

Parsing ¡quesNon ¡to ¡produce ¡formal ¡queries ¡

What ¡does ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Theme ¡ Theme ¡

split ¡ absorb ¡ water ¡ light ¡

(Enable|Super)+ ¡

split ¡ transfer ¡ water ¡ ions ¡

Theme ¡ Theme ¡ (Enable|Super)+ ¡

  • 1. Align ¡Q&A ¡triggers ¡and ¡

arguments ¡to ¡structure ¡

  • 2. IdenNfy ¡source ¡and ¡target ¡ ¡
  • 3. IdenNfy ¡regular ¡expressions ¡

¡From ¡small ¡set ¡(~10) ¡

slide-39
SLIDE 39

Where ¡are ¡we? ¡

Water ¡is ¡split, ¡providing ¡a ¡source ¡of ¡ electrons ¡and ¡protons ¡(hydrogen ¡ions, ¡H+) ¡ and ¡giving ¡off ¡O2 ¡as ¡a ¡by-­‑product. ¡Light ¡ absorbed ¡by ¡chlorophyll ¡drives ¡a ¡transfer ¡

  • f ¡the ¡electrons ¡and ¡hydrogen ¡ions ¡from ¡

water ¡to ¡an ¡acceptor ¡called ¡NADP+. ¡ ¡ What ¡can ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

Step ¡3: ¡Answer ¡= ¡B ¡ Answering ¡QuesNon ¡

slide-40
SLIDE 40
  • Given ¡ ¡

– Process ¡structure ¡ – Two ¡queries ¡

  • Answering ¡algorithm ¡

Step ¡3: ¡Answering ¡quesNons ¡

slide-41
SLIDE 41
  • Given ¡ ¡

– Process ¡structure ¡ – Two ¡queries ¡

  • Answering ¡algorithm ¡
  • 1. Find ¡matching ¡path ¡(valid ¡proof) ¡

Step ¡3: ¡Answering ¡quesNons ¡

slide-42
SLIDE 42
  • Given ¡ ¡

– Process ¡structure ¡ – Two ¡queries ¡

  • Answering ¡algorithm ¡
  • 1. Find ¡matching ¡path ¡(valid ¡proof) ¡
  • 2. Else, ¡find ¡contradicNon ¡of ¡causality ¡(refutaNon) ¡

Step ¡3: ¡Answering ¡quesNons ¡

slide-43
SLIDE 43
  • Given ¡ ¡

– Process ¡structure ¡ – Two ¡queries ¡

  • Answering ¡algorithm ¡
  • 1. Find ¡matching ¡path ¡(valid ¡proof) ¡
  • 2. Else, ¡find ¡contradicNon ¡of ¡causality ¡(refutaNon) ¡
  • 3. Back ¡off ¡to ¡baseline ¡

Step ¡3: ¡Answering ¡quesNons ¡

slide-44
SLIDE 44

Experiments ¡and ¡Results ¡

slide-45
SLIDE 45

QuesNon ¡Answering ¡Accuracy ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

Train: ¡150 ¡processes ¡ Test: ¡50 ¡processes ¡

slide-46
SLIDE 46

QuesNon ¡Answering ¡Accuracy ¡

50 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

slide-47
SLIDE 47

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

slide-48
SLIDE 48

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

slide-49
SLIDE 49

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡ 60 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

slide-50
SLIDE 50

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡ 60 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

Shallow ¡approaches ¡don’t ¡

  • work. ¡Difficult ¡task. ¡
slide-51
SLIDE 51

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡ 60 ¡ 76.7 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

Shallow ¡approaches ¡don’t ¡

  • work. ¡Difficult ¡task. ¡
slide-52
SLIDE 52

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡ 60 ¡ 76.7 ¡ 67.6 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

Shallow ¡approaches ¡don’t ¡

  • work. ¡Difficult ¡task. ¡
slide-53
SLIDE 53

QuesNon ¡Answering ¡Accuracy ¡

50 ¡ 46.7 ¡ 54 ¡ 60 ¡ 76.7 ¡ 67.6 ¡

Random ¡ Bag-­‑of-­‑words ¡ Text ¡ Proximity ¡ Dependency ¡ Proximity ¡

ProRead

¡ Gold ¡ structure ¡

Structure ¡helps ¡ Shallow ¡approaches ¡don’t ¡

  • work. ¡Difficult ¡task. ¡
slide-54
SLIDE 54

Reading ¡comprehension ¡errors ¡

  • Errors ¡with ¡predicted ¡structure ¡ ¡

– Structure ¡error ¡(55%) ¡ – Alignment ¡(10%) ¡ – AnnotaNon ¡mismatch ¡(10%) ¡ – EnNty ¡coreference ¡(10%) ¡

  • Errors ¡with ¡gold ¡structure ¡

– Alignment ¡(35%) ¡ – AnnotaNon ¡mismatch ¡(25%) ¡ – EnNty ¡coreference ¡(20%) ¡

slide-55
SLIDE 55

Summary ¡

This ¡work ¡

– A ¡new ¡reading ¡comprehension ¡task ¡ – A ¡dataset ¡of ¡structures ¡with ¡Q&A: ¡ProcessBank ¡ – An ¡end-­‑to-­‑end ¡system ¡for ¡quesNon ¡answering ¡via ¡predicted ¡structures ¡ – Rich ¡enNty ¡and ¡event ¡structure ¡helps ¡

slide-56
SLIDE 56

Summary ¡

This ¡work ¡

– A ¡new ¡reading ¡comprehension ¡task ¡ – A ¡dataset ¡of ¡structures ¡with ¡Q&A: ¡ProcessBank ¡ – An ¡end-­‑to-­‑end ¡system ¡for ¡quesNon ¡answering ¡via ¡predicted ¡structures ¡ – Rich ¡enNty ¡and ¡event ¡structure ¡helps ¡

Bigger ¡picture ¡

– Wanted: ¡Programs ¡that ¡read, ¡understand ¡& ¡reason ¡about ¡text ¡ – Processes ¡are ¡complex ¡phenomena ¡that ¡are ¡extensively ¡described ¡in ¡ text ¡) Great ¡test-­‑bed ¡ – Ties ¡together ¡many ¡NLP ¡strands: ¡informaNon ¡extracNon, ¡semanNc ¡role ¡ labeling, ¡semanNc ¡parsing ¡and ¡reading ¡comprehension ¡ – Towards ¡machine ¡reading ¡

slide-57
SLIDE 57

Summary ¡

This ¡work ¡

– A ¡new ¡reading ¡comprehension ¡task ¡ – A ¡dataset ¡of ¡structures ¡with ¡Q&A: ¡ProcessBank ¡ – An ¡end-­‑to-­‑end ¡system ¡for ¡quesNon ¡answering ¡via ¡predicted ¡structures ¡ – Rich ¡enNty ¡and ¡event ¡structure ¡helps ¡

Bigger ¡picture ¡

– Wanted: ¡Programs ¡that ¡read, ¡understand ¡& ¡reason ¡about ¡text ¡ – Processes ¡are ¡complex ¡phenomena ¡that ¡are ¡extensively ¡described ¡in ¡ text ¡) Great ¡test-­‑bed ¡ – Ties ¡together ¡many ¡NLP ¡strands: ¡informaNon ¡extracNon, ¡semanNc ¡role ¡ labeling, ¡semanNc ¡parsing ¡and ¡reading ¡comprehension ¡ – Towards ¡machine ¡reading ¡

Thank ¡you! ¡

http://nlp.stanford.edu/software/bioprocess/

slide-58
SLIDE 58
slide-59
SLIDE 59

Extra ¡slides ¡

slide-60
SLIDE 60

Non-­‑factoid ¡quesNons: ¡AP ¡Exams ¡

In ¡the ¡development ¡of ¡a ¡seedling, ¡which ¡of ¡the ¡ following ¡will ¡be ¡the ¡last ¡to ¡occur? ¡

  • A. IniNaNon ¡of ¡the ¡breakdown ¡of ¡the ¡food ¡reserve ¡
  • B. IniNaNon ¡of ¡cell ¡division ¡in ¡the ¡root ¡meristem ¡
  • C. Emergence ¡of ¡the ¡root ¡
  • D. Emergence ¡and ¡greening ¡of ¡the ¡first ¡true ¡foliage ¡leaves ¡
  • E. ImbibiNon ¡of ¡water ¡by ¡the ¡seed ¡

Actual ¡order: ¡E ¡A ¡C ¡B ¡D ¡

slide-61
SLIDE 61

Temporal ¡vs. ¡Causal ¡dependencies ¡

Related: ¡Temporal ¡relaNons ¡between ¡biological ¡events ¡

– Causal ¡dependencies ¡! ¡Relevant ¡temporal ¡relaNons ¡ – What ¡about ¡the ¡others? ¡

split ¡ absorb ¡ transfer ¡ Enable ¡ Cause ¡

Temporal ¡ordering ¡of ¡split, ¡absorb ¡unspecified ¡ split ¡and ¡absorb ¡before ¡transfer ¡

[Scaria, ¡et ¡al, ¡2013] ¡

slide-62
SLIDE 62

Joint ¡inference ¡with ¡constraints ¡

  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Unique ¡SUPER ¡parent ¡
  • 6. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡
slide-63
SLIDE 63

Joint ¡inference ¡with ¡constraints ¡

  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Unique ¡SUPER ¡parent ¡
  • 6. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

Event ¡1 ¡ Event ¡3 ¡ Event ¡2 ¡ SUPER ¡ SUPER ¡

Not ¡allowed! ¡

slide-64
SLIDE 64
  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Unique ¡SUPER ¡parent ¡
  • 6. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

R ¡

Joint ¡inference ¡with ¡constraints ¡

Event ¡1 ¡ Event ¡2 ¡ EnNty ¡ Result ¡ Agent ¡

Not ¡allowed! ¡

slide-65
SLIDE 65

Joint ¡inference ¡with ¡constraints ¡

  • 1. No ¡overlapping ¡arguments ¡
  • 2. Maximum ¡number ¡of ¡arguments ¡per ¡trigger ¡
  • 3. Maximum ¡number ¡of ¡triggers ¡per ¡enNty ¡
  • 4. ConnecNvity ¡
  • 5. Unique ¡SUPER ¡parent ¡
  • 6. Events ¡that ¡share ¡arguments ¡must ¡be ¡related ¡

R ¡

Event ¡1 ¡ Event ¡2 ¡ EnNty ¡ Result ¡ Agent ¡ Enable ¡

slide-66
SLIDE 66

Trigger ¡classificaNon ¡

  • Regularized ¡logisNc ¡regression ¡
  • Features ¡

– SyntacNc: ¡POS ¡tag, ¡path ¡to ¡root, ¡… ¡ – SemanNc ¡

  • WordNet ¡
  • NomLex ¡
  • Levin ¡verb ¡classes ¡
  • GazeEeer ¡from ¡Wikipedia ¡

– SyntacNc ¡and ¡linear ¡context ¡

slide-67
SLIDE 67

Event-­‑arguments ¡and ¡event-­‑event ¡relaNons ¡

  • y, ¡z: ¡decision ¡variables ¡for ¡inference ¡
  • b, ¡c: ¡scores ¡for ¡corresponding ¡decision ¡

– Dot ¡products ¡of ¡weights ¡and ¡features ¡

  • Features ¡

– Event-­‑argument ¡features ¡based ¡on ¡semanNc ¡role ¡labeling ¡features ¡ – Event-­‑event ¡features ¡based ¡on ¡[Scaria ¡et ¡al, ¡2013] ¡ – Dependency ¡paths, ¡connecNves, ¡context, ¡linear ¡distance, ¡clustering ¡ features,… ¡

slide-68
SLIDE 68

Aligning ¡quesNon-­‑answers ¡to ¡structure ¡

What ¡does ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡ A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

split ¡ absorb ¡ transfer ¡ water ¡ light ¡ ions ¡ Theme ¡ Theme ¡ Theme ¡ Enable ¡ Cause ¡

slide-69
SLIDE 69

Source ¡and ¡target ¡idenNficaNon ¡

  • “lead ¡to” ¡= ¡“cause” ¡(WordNet) ¡
  • QuesNon ¡word ¡(“what”) ¡is ¡an ¡indirect ¡object ¡
  • Sentence ¡is ¡in ¡acNve ¡voice ¡

¡Answer ¡should ¡be ¡the ¡target ¡of ¡query ¡path ¡ What ¡does ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡

slide-70
SLIDE 70

SelecNng ¡query ¡regular ¡expression ¡

  • “spliKng” ¡is ¡an ¡event ¡
  • “transfer” ¡and ¡“absorpNon” ¡are ¡events ¡
  • Looking ¡for ¡event ¡! ¡event ¡path ¡
  • “lead ¡to” ¡= ¡“cause” ¡

Same*(Enable|Super)+Same*


  • What ¡does ¡the ¡spliKng ¡of ¡water ¡lead ¡to? ¡ ¡

A: ¡Light ¡absorpNon ¡ ¡ B: ¡Transfer ¡of ¡ions ¡ ¡

slide-71
SLIDE 71

Structure ¡PredicNon ¡Performance ¡

¡ ¡

Precision ¡ Recall ¡ F1 ¡ Triggers ¡ 75.8 ¡ 73.9 ¡ 74.8 ¡

  • Arg. ¡Iden. ¡

57.3 ¡ 45.6 ¡ 50.8 ¡ SRL ¡ 42.5 ¡ 33.9 ¡ 37.7 ¡ RelaNons ¡ 26.5 ¡ 21.8 ¡ 23.9 ¡

Nuanced ¡differences ¡in ¡structures ¡don’t ¡always ¡maEer ¡ ¡ ¡

Event ¡1 ¡ Event ¡2 ¡ Event ¡3 ¡