Thirty Musts for Meaning Banking Johan Bos & Lasha - - PowerPoint PPT Presentation

thirty musts for meaning banking johan bos lasha
SMART_READER_LITE
LIVE PREVIEW

Thirty Musts for Meaning Banking Johan Bos & Lasha - - PowerPoint PPT Presentation

Thirty Musts for Meaning Banking Johan Bos & Lasha Abzianidze Look at other meaning banks! 1 1 Damon showed me his stamp album. Select public domain corpora!


slide-1
SLIDE 1

Thirty ¡Musts ¡for ¡ Meaning ¡Banking ¡ ¡

Johan ¡Bos ¡& ¡Lasha ¡Abzianidze ¡

slide-2
SLIDE 2

Look ¡at ¡other ¡meaning ¡banks! ¡

1 1

slide-3
SLIDE 3

Damon showed me his stamp album.

slide-4
SLIDE 4

Select ¡public ¡domain ¡corpora! ¡

2 2

slide-5
SLIDE 5

¡ ¡ ¡Freeze ¡the ¡corpus ¡before ¡you ¡start! ¡

3 3

slide-6
SLIDE 6

¡ ¡ ¡ ¡Work ¡with ¡raw ¡texts ¡in ¡your ¡corpus! ¡

  • words ¡≠ ¡atoms ¡of ¡meaning ¡
  • tokenisa=on ¡decisions ¡can ¡change ¡
  • never ¡carry ¡out ¡annota=on ¡on ¡tokenised ¡text ¡
  • don’t ¡think ¡“syntax” ¡can ¡fix ¡word ¡boundaries ¡

¡ ¡

4 4

New ¡York-­‑based ¡companies ¡… ¡ ¡

slide-7
SLIDE 7

Use ¡stand-­‑off ¡annotaAon! ¡

  • keep ¡annota=ons ¡separate ¡from ¡original ¡
  • use ¡character ¡offsets ¡of ¡original ¡(raw) ¡text ¡
  • effec=ve ¡if ¡various ¡annota=on ¡layers ¡are ¡

involved ¡

5 5

slide-8
SLIDE 8

Consider ¡manual ¡annotaAon! ¡

  • Many ¡meaning ¡banks ¡are ¡created ¡with ¡the ¡

help ¡of ¡a ¡computa=onal ¡grammar ¡(ERG, ¡CCG) ¡

  • But ¡there ¡is ¡an ¡alterna=ve: ¡ ¡

manually ¡produce ¡ ¡ meanings ¡(AMR) ¡

6 6

(b/base-­‑01 ¡ ¡ ¡ ¡ ¡:ARG0 ¡(c/company) ¡ ¡ ¡ ¡ ¡:Loca=on ¡(c/city ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡:Name ¡(n/name ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡:Op1 ¡“New” ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡:Op2 ¡“York”))) ¡

slide-9
SLIDE 9

¡ ¡ ¡Make ¡a ¡friendly ¡annotaAon ¡interface! ¡

  • Annota=on ¡can ¡be ¡fun ¡– ¡but ¡also ¡tedious ¡
  • Web-­‑based, ¡search ¡facili=es, ¡sta=s=cs ¡
  • Sanity ¡checker ¡

7 7

slide-10
SLIDE 10

¡ ¡ ¡Include ¡an ¡issue ¡reporAng ¡system! ¡

  • Annotators ¡will ¡find ¡bugs, ¡raise ¡ques=ons, ¡
  • bserve ¡interes=ng ¡phenomena ¡
  • Provide ¡means ¡to ¡record ¡this ¡valuable ¡

informa=on ¡

  • There ¡are ¡several ¡exis=ng ¡issue ¡repor=ng ¡

systems ¡available ¡(e.g., ¡MANTIS) ¡

8 8

slide-11
SLIDE 11

Be ¡careful ¡with ¡the ¡crowd! ¡

  • GamificaAon: ¡ ¡

slow ¡and ¡hard ¡to ¡recruit ¡new ¡players ¡

  • Crowdsourcing: ¡

payment ¡and ¡dealing ¡with ¡cheaters ¡

9 9

slide-12
SLIDE 12

¡ ¡ ¡ ¡ ¡ ¡ ¡Profit ¡from ¡lexicalised ¡grammars! ¡

  • A ¡lexicalised ¡grammar ¡(e.g. ¡CCG) ¡gives ¡an ¡

advantage ¡in ¡annota=ng ¡syntac=c ¡structure ¡

  • Thema=c ¡roles ¡can ¡be ¡directly ¡coupled ¡to ¡

lexical ¡entries ¡(words) ¡

10 10

Amy ¡ ¡loves ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Bob ¡. ¡ NP ¡ ¡ ¡ ¡(S\NP)/NP ¡ ¡NP ¡ ¡ ¡S\S ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡[S=m,Exp] ¡

slide-13
SLIDE 13

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Don’t ¡focus ¡on ¡just ¡one ¡language! ¡

  • Most ¡meaning ¡banks: ¡one ¡language ¡(English) ¡
  • Risky! ¡
  • Meanings ¡ought ¡to ¡be ¡

abstract ¡(language ¡neutral) ¡

  • Parallel ¡corpora! ¡

29 29

slide-14
SLIDE 14

¡ ¡ ¡ ¡ ¡ ¡ ¡Try ¡to ¡use ¡language-­‑neutral ¡tools! ¡

  • Tokenisers, ¡taggers, ¡parsers, ¡boxers ¡
  • Resources ¡tailored ¡to ¡a ¡par=cular ¡ ¡

language ¡… ¡

  • … ¡prevent ¡por=ng ¡your ¡ ¡

method ¡to ¡other ¡languages ¡

11 11

slide-15
SLIDE 15

¡ ¡ ¡ ¡Apply ¡normalisaAon ¡to ¡symbols! ¡

12 12

Expression ¡ Meaning ¡ 2pm ¡ 14:00 ¡ half ¡past ¡eight ¡ 08:30 ¡ five ¡to ¡ten ¡ 09:55 ¡ Expression ¡ Meaning ¡ forty ¡five ¡ 45 ¡ two ¡hundred ¡ 200 ¡ 367 ¡ 367 ¡

slide-16
SLIDE 16

Limit ¡underspecificaAon! ¡

  • Underspecifica=on ¡hinders ¡inference ¡
  • Provide ¡most ¡plausible ¡interpreta=on ¡

¡

Tom ¡got ¡stuck ¡in ¡his ¡sleeping ¡bag. ¡

13 13

sleeping_bag.n.01(x) ¡ bag.n.01(x) ¡ sleep.v.01(e) ¡ ¡ ¡ ¡ ¡ ¡Agent(e,x) ¡ z ¡Z ¡Z ¡Z ¡

slide-17
SLIDE 17

Beware ¡of ¡annotaAon ¡bias! ¡

  • Most ¡plausible ¡interpreta=on ¡can ¡also ¡give ¡

unfair ¡balance ¡to ¡stereotypes ¡

  • Examples: ¡ ¡

– gender ¡ – word ¡sense ¡

14 14

slide-18
SLIDE 18

¡ ¡ ¡ ¡ ¡ ¡ ¡Use ¡exisAng ¡resources ¡for ¡word ¡senses! ¡ 15 15

slide-19
SLIDE 19

Apply ¡symbol ¡grounding! ¡

  • words ¡à ¡concepts ¡
  • named ¡en==es ¡à ¡wikifica=on ¡(AMR) ¡
  • toponyms ¡à ¡GPS ¡coordinates ¡
  • visualisa=on ¡of ¡concepts ¡or ¡ac=ons ¡
  • crea=ng ¡=melines ¡

16 16

slide-20
SLIDE 20

Adopt ¡neo-­‑Davidsonian ¡events! ¡

  • Davidson ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡eat(e,x) ¡ ¡eat(e,x,y) ¡
  • Hobbs ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡eat(e,x,y,z) ¡
  • Parsons ¡

¡ ¡eat(e) ¡ ¡Agent(e,x) ¡Pa=ent(e,y) ¡ ¡

17 17

slide-21
SLIDE 21

¡ ¡ ¡ ¡ ¡ ¡ ¡Use ¡exisAng ¡role-­‑labelling ¡inventories! ¡

  • PropBank: ¡ ¡ ¡small ¡set ¡(6) ¡of ¡universal ¡roles ¡
  • VerbNet: ¡ ¡ ¡ ¡ ¡larger ¡set ¡(ca. ¡25) ¡of ¡universal ¡roles ¡
  • FrameNet: ¡ ¡specific ¡roles ¡for ¡each ¡frame ¡

¡ Also ¡needed: ¡rela=ons ¡for ¡ preposi=ons, ¡noun ¡compounds, ¡possessives ¡

18 18

slide-22
SLIDE 22

Treat ¡role ¡nouns ¡differently! ¡

  • agent ¡and ¡recipient ¡nouns ¡are ¡rela=onal ¡

(worker, ¡employee, ¡vicAm, ¡denAst) ¡

  • trea=ng ¡them ¡as ¡one-­‑place ¡predicates ¡gives ¡rise ¡

to ¡contradic=ons ¡

  • AMR ¡and ¡PMB ¡pursue ¡this ¡approach ¡

¡ ¡ ¡ ¡(Mia’s ¡husband ¡is ¡Vincent’s ¡boss) ¡

19 19

slide-23
SLIDE 23

¡ ¡ ¡Beware ¡of ¡geopoliAcal ¡enAAes! ¡

  • Names ¡for ¡GPEs ¡can ¡refer ¡to ¡ ¡

loca=ons, ¡governments, ¡sport ¡squads, ¡people ¡

  • Systema=c ¡polysemy: ¡ ¡

ci=es, ¡states, ¡countries, ¡con=nents, ¡etc. ¡

  • See ¡ACE ¡annota=on ¡guidelines ¡

20 20

slide-24
SLIDE 24

Give ¡scope ¡to ¡negaAon! ¡

  • sentence ¡meaning ¡is ¡about ¡truth ¡condi=ons ¡
  • negaAon ¡plays ¡a ¡crucial ¡role ¡here ¡
  • proper ¡treatment ¡requires ¡scope: ¡ ¡¬(…) ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(concord, ¡affixes, ¡raising) ¡

21 21

slide-25
SLIDE 25

¡ ¡ ¡ ¡ ¡ ¡ ¡Pay ¡aPenAon ¡to ¡compound ¡words! ¡

22 22

Expression ¡ Meaning ¡ hard ¡hat ¡ hard_hat.n.02(x) ¡ peanut ¡burer ¡ peanut_burer.01(x) ¡

  • ld ¡woman ¡
  • ld_woman.n.01(x) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡??? ¡

secretary ¡of ¡state ¡ secretary_of_state.n.01(x) ¡ North ¡and ¡South ¡Dakota ¡ state.n.01(x) ¡&Name(x,North_Dakota) ¡& ¡… ¡ Jingle ¡Bells ¡ song.n.01(x) ¡& ¡Name(x,Jingle_Bells) ¡ Lucy ¡in ¡the ¡Sky ¡with ¡Diamonds ¡ Several ¡Species ¡of ¡Small ¡Furry ¡Animals ¡Gathered ¡Together ¡in ¡a ¡Cave ¡and ¡Grooving ¡With ¡A ¡Pict ¡

slide-26
SLIDE 26

Use ¡inference ¡tests ¡in ¡design! ¡

  • Amy ¡is ¡a ¡smart ¡woman ¡-­‑-­‑-­‑-­‑-­‑> ¡Amy ¡is ¡a ¡woman ¡

Amy ¡is ¡ten ¡years ¡old ¡ ¡-­‑-­‑-­‑-­‑> ¡ ¡Amy ¡is ¡old ¡ ¡ ¡

23 23

no ¡ yes ¡

slide-27
SLIDE 27

Use ¡inference ¡tests ¡in ¡design! ¡

  • Amy ¡is ¡a ¡smart ¡woman ¡-­‑-­‑-­‑-­‑-­‑> ¡Amy ¡is ¡a ¡woman ¡

Amy ¡is ¡ten ¡years ¡old ¡ ¡-­‑-­‑-­‑-­‑> ¡ ¡Amy ¡is ¡old ¡ ¡ ¡

  • Bob ¡is ¡unhappy ¡ ¡ ¡-­‑-­‑-­‑-­‑> ¡Bob ¡is ¡not ¡happy ¡

Bob ¡is ¡not ¡happy ¡-­‑-­‑-­‑-­‑> ¡Bob ¡is ¡unhappy ¡ ¡

23 23

no ¡ ¡no ¡ yes ¡ yes ¡

slide-28
SLIDE 28

Use ¡inference ¡tests ¡in ¡design! ¡

  • Amy ¡is ¡a ¡smart ¡woman ¡-­‑-­‑-­‑-­‑-­‑> ¡Amy ¡is ¡a ¡woman ¡

Amy ¡is ¡ten ¡years ¡old ¡ ¡-­‑-­‑-­‑-­‑> ¡ ¡Amy ¡is ¡old ¡ ¡ ¡

  • Bob ¡is ¡unhappy ¡ ¡ ¡-­‑-­‑-­‑-­‑> ¡Bob ¡is ¡not ¡happy ¡

Bob ¡is ¡not ¡happy ¡-­‑-­‑-­‑-­‑> ¡Bob ¡is ¡unhappy ¡ ¡

  • Florence ¡is ¡the ¡cultural ¡capital ¡of ¡Italy ¡-­‑-­‑-­‑> ¡ ¡ ¡ ¡ ¡ ¡

Florence ¡is ¡the ¡capital ¡of ¡Italy ¡ ¡ ¡ ¡ ¡

23 23

no ¡ ¡no ¡ no ¡ yes ¡ yes ¡

slide-29
SLIDE 29

Divide ¡and ¡conquer! ¡

  • compu=ng ¡meaning ¡is ¡very ¡hard ¡
  • many ¡unsolved ¡representa=on ¡problems ¡

– aspect ¡ – informa=on ¡structure ¡(focus) ¡ – presupposi=ons ¡ – generics ¡ – plurals ¡

24 24

slide-30
SLIDE 30

¡ ¡ ¡ ¡ ¡Put ¡complex ¡presupposiAons ¡on ¡hold! ¡

  • some ¡presupposi=ons ¡triggers ¡can ¡be ¡analysed ¡

as ¡being ¡anaphoric ¡(definites, ¡names) ¡

  • but ¡more ¡complex ¡cases ¡require ¡copying ¡or ¡
  • ther ¡sophis=cated ¡opera=ons ¡

¡ (the ¡crowd ¡applauded ¡again) ¡

25 25

slide-31
SLIDE 31

Respect ¡ellipAcal ¡expressions! ¡

  • Invisible, ¡but ¡omnipresent… ¡
  • Many ¡different ¡types ¡of ¡ellipsis ¡

¡ ¡ ¡ ¡ ¡My ¡hair ¡is ¡longer ¡than ¡Mary’s ¡ø. ¡ ¡ ¡ ¡ ¡Tom ¡eats ¡fish, ¡but ¡his ¡brother ¡doesn’t ¡ø. ¡ ¡ ¡ ¡ ¡ø ¡Ho ¡fame. ¡ ¡ ¡ ¡ ¡

26 26

slide-32
SLIDE 32

Think ¡about ¡generics! ¡

  • generics, ¡habituals, ¡kinds ¡
  • hard ¡to ¡model ¡in ¡first-­‑order ¡representa=ons ¡

¡ ¡ ¡ ¡ ¡A ¡lion ¡is ¡strong. ¡ ¡ ¡ ¡ ¡Who ¡invented ¡the ¡typewriter? ¡ ¡ ¡ ¡ ¡I ¡play ¡the ¡piano. ¡

27 27

slide-33
SLIDE 33

Don’t ¡try ¡to ¡be ¡clever! ¡

The ¡fork ¡is ¡on ¡the ¡table. ¡ Mary ¡is ¡an ¡engineer. ¡ John ¡is ¡the ¡teacher ¡who ¡graded ¡my ¡essay. ¡ ¡

28 28

slide-34
SLIDE 34

¡ ¡ ¡ ¡ ¡Measure ¡meaning ¡discrepancies! ¡

  • Need ¡to ¡be ¡able ¡to ¡compare ¡meaning ¡

representa=ons ¡

  • Current ¡approaches ¡based ¡on ¡Allen ¡et ¡al. ¡2008 ¡

(Smatch ¡for ¡AMR, ¡Counter ¡for ¡DRS) ¡

  • We ¡need ¡to ¡make ¡“matching” ¡more ¡

seman=cal ¡

30 30

slide-35
SLIDE 35

The ¡End ¡

pmb.let.rug.nl ¡