Ac#ve Learning and Crowd- Sourcing for Machine Transla#on - - PowerPoint PPT Presentation

ac ve learning and crowd sourcing for machine transla on
SMART_READER_LITE
LIVE PREVIEW

Ac#ve Learning and Crowd- Sourcing for Machine Transla#on - - PowerPoint PPT Presentation

Ac#ve Learning and Crowd- Sourcing for Machine Transla#on Vamshi Amba#, Stephan Vogel, & Jamie Carbonell Pramod Thammaiah ScoC Brinker November 17,


slide-1
SLIDE 1

Ac#ve ¡Learning ¡and ¡Crowd-­‑ Sourcing ¡for ¡Machine ¡Transla#on ¡

Vamshi ¡Amba#, ¡Stephan ¡Vogel, ¡ & ¡Jamie ¡Carbonell ¡

Pramod ¡Thammaiah ¡ ScoC ¡Brinker ¡ November ¡17, ¡2010 ¡ CS ¡286r ¡

slide-2
SLIDE 2
  • Ac#ve ¡Learning: ¡a ¡few ¡labeled ¡instances, ¡a ¡large ¡set ¡
  • f ¡unlabeled ¡instances, ¡and ¡a ¡ranking ¡of ¡instances ¡for ¡

an ¡external ¡oracle ¡to ¡label ¡them ¡

  • Ac#ve ¡Crowd ¡Transla#on: ¡using ¡crowd-­‑sourced ¡

experts ¡and ¡non-­‑experts ¡to ¡translate ¡sentences ¡as ¡ the ¡external ¡oracle ¡

  • Mechanical ¡Turk: ¡Amazon’s ¡crowd-­‑sourcing ¡plaQorm ¡

where ¡“requesters” ¡post ¡HITs ¡(human ¡intelligence ¡ tasks) ¡for ¡“turkers” ¡to ¡complete ¡in ¡exchange ¡for ¡ micropayment ¡rewards. ¡

slide-3
SLIDE 3
slide-4
SLIDE 4
slide-5
SLIDE 5
  • Qualifica#ons ¡for ¡turkers ¡can ¡include: ¡

– Sufficient ¡accuracy ¡on ¡a ¡small ¡test ¡set ¡ – Minimum ¡percentage ¡of ¡previously ¡accepted ¡submission ¡ – Geographic ¡loca#on ¡(e.g., ¡China ¡for ¡Chinese ¡transla#on) ¡ – Op#on ¡to ¡reject ¡unsa#sfactory ¡work ¡

  • Pricing ¡for ¡turkers ¡varies, ¡but ¡generally ¡inexpensive: ¡

– As ¡low ¡as ¡as ¡< ¡$0.01 ¡per ¡transla#on ¡ – Empirical ¡study ¡in ¡paper ¡averaged ¡$0.015/transla#on ¡ – Supply/demand ¡factors ¡for ¡less ¡common ¡languages ¡

slide-6
SLIDE 6
slide-7
SLIDE 7

Density ¡Weighted ¡Diversity ¡Sampling ¡(DWDS) ¡Strategy ¡

slide-8
SLIDE 8
slide-9
SLIDE 9
  • Transla#on ¡Reliability ¡Es#ma#on ¡as ¡inter-­‑annotator ¡

agreement ¡

– ¡ ¡Agreement ¡of ¡3/3 ¡translators ¡21.1% ¡of ¡the ¡#me ¡ – ¡ ¡Agreement ¡of ¡2/3 ¡translators ¡23.8% ¡of ¡the ¡#me ¡

  • Translator ¡Reliability ¡Es#ma#on ¡as ¡iden#fying ¡

reliable ¡translators ¡over ¡a ¡series ¡of ¡transla#ons ¡

slide-10
SLIDE 10
slide-11
SLIDE 11
slide-12
SLIDE 12
slide-13
SLIDE 13
  • Catalog ¡and ¡data ¡management ¡

– Confirm ¡accuracy ¡of ¡catalog ¡data, ¡iden#fy ¡duplicates ¡ – Select ¡best ¡images ¡to ¡showcase ¡a ¡catalog ¡item ¡

  • Database ¡crea#on ¡

– Content ¡harves#ng ¡

  • Search ¡op#miza#on ¡& ¡content ¡management ¡

– Tag ¡content ¡with ¡keywords ¡to ¡improve ¡searchability ¡ – Ensure ¡content ¡adheres ¡to ¡certain ¡guidelines ¡

Mechanical ¡Turk ¡in ¡Commercial ¡Applica#ons ¡

slide-14
SLIDE 14
  • Other ¡applica#ons? ¡
  • Ethical ¡concerns? ¡

Ques#ons ¡About ¡Crowdsourcing ¡with ¡Mechanical ¡Turk ¡

slide-15
SLIDE 15

Crowdsourcing ¡and ¡All-­‑Pay ¡ Auc#ons ¡

Pramod ¡Thammaiah ¡ ScoC ¡Brinker ¡ November ¡17, ¡2010 ¡ CS ¡286r ¡

slide-16
SLIDE 16

Introduc#on ¡

  • Examines ¡crowdsourcing ¡in ¡things ¡like ¡Tasken, ¡

Yahoo! ¡Answers, ¡etc. ¡ ¡

  • Want ¡to ¡understand ¡the ¡rela#onship ¡between ¡

rewards ¡and ¡par#cipa#on ¡rates ¡

  • Presents ¡mathema#cal ¡model ¡and ¡empirical ¡

analysis ¡based ¡off ¡of ¡All-­‑pay ¡auc#ons ¡

slide-17
SLIDE 17
slide-18
SLIDE 18
slide-19
SLIDE 19
slide-20
SLIDE 20

All ¡Pay ¡Auc#ons ¡

  • All-­‑pay ¡auc#ons ¡are ¡those ¡where ¡each ¡agent ¡

pays ¡their ¡bid ¡before ¡alloca#on ¡of ¡the ¡good ¡

  • The ¡highest ¡bidder ¡wins ¡the ¡good ¡
  • Examples: ¡poli#cal ¡elec#ons, ¡Swoopo, ¡

lobbying, ¡bidding ¡on ¡the ¡value ¡of ¡a ¡wallet, ¡etc. ¡ ¡ ¡

slide-21
SLIDE 21

Basic ¡Model ¡

  • Consider ¡a ¡2-­‑stage ¡all-­‑pay ¡auc#on ¡

– Each ¡player ¡selects ¡a ¡contest ¡and ¡makes ¡a ¡bid ¡ (think ¡of ¡the ¡bid ¡as ¡effort) ¡ – For ¡each ¡contest, ¡the ¡player ¡with ¡the ¡highest ¡bid ¡ wins ¡

  • Each ¡player ¡has ¡a ¡private ¡skill ¡that ¡is ¡known ¡
  • nly ¡to ¡them ¡
  • The ¡reward ¡of ¡each ¡contest ¡and ¡the ¡

distribu#on ¡of ¡skills ¡is ¡known ¡to ¡all ¡players ¡

slide-22
SLIDE 22

Mock ¡contest ¡

  • Pick ¡one ¡of ¡the ¡2 ¡contests: ¡

– Write ¡the ¡best ¡joke ¡ – Write ¡the ¡best ¡riddle ¡

  • The ¡winner ¡will ¡be ¡selected ¡by ¡Prof. ¡Chen ¡

– So ¡make ¡them ¡short…. ¡

  • The ¡best ¡joke ¡will ¡get ¡$1 ¡and ¡the ¡best ¡riddle ¡

will ¡get ¡$2 ¡

slide-23
SLIDE 23

Mathema#cal ¡Formula#on ¡

  • ¡ ¡
slide-24
SLIDE 24

Proposi#on ¡3.1: ¡There ¡exists ¡a ¡ symmetric ¡equilibrium ¡

  • Let ¡ ¡ ¡ ¡ ¡ ¡be ¡the ¡probability ¡that ¡a ¡player ¡selects ¡contest ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡be ¡the ¡

cumula#ve ¡distribu#on ¡over ¡skill ¡for ¡a ¡player ¡given ¡that ¡he ¡selects ¡ ¡ ¡, ¡and ¡

  • Let ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡denote ¡the ¡expected ¡profit ¡of ¡a ¡player ¡with ¡skill ¡ ¡ ¡ ¡ ¡for ¡contest ¡

then ¡using ¡Revenue ¡Equivalence ¡we ¡have: ¡

  • Note ¡that ¡this ¡is ¡not ¡an ¡unique ¡equilibrium ¡

– Consider ¡2 ¡players ¡and ¡2 ¡contests. ¡Then ¡player ¡1 ¡always ¡picking ¡contest ¡1 ¡and ¡player ¡2 ¡ always ¡picking ¡contest ¡2 ¡regardless ¡of ¡skill ¡is ¡an ¡asymmetric ¡equilibrium ¡

  • Corollary: ¡Given ¡a ¡set ¡of ¡contests ¡with ¡the ¡same ¡reward. ¡A ¡player ¡will ¡only ¡

choose ¡a ¡contest ¡in ¡that ¡he ¡has ¡the ¡maximum ¡skill. ¡ ¡

  • Assume ¡that ¡all ¡players ¡only ¡choose ¡symmetric ¡strategies ¡
slide-25
SLIDE 25

Large-­‑System ¡Limit ¡

  • The ¡number ¡of ¡contests ¡needs ¡to ¡stay ¡

propor#onal ¡to ¡the ¡number ¡of ¡agents ¡in ¡the ¡ limit ¡

  • Assume ¡that ¡there ¡are ¡only, ¡K, ¡ ¡finitely ¡many ¡

classes ¡of ¡rewards ¡

  • The ¡number ¡of ¡par#cipants ¡in ¡each ¡contest ¡is ¡a ¡

Poisson ¡random ¡variable, ¡whose ¡mean ¡is ¡ logarithmic ¡in ¡the ¡size ¡of ¡the ¡reward ¡

slide-26
SLIDE 26

Player-­‑Specific ¡skills ¡

  • Assume ¡that ¡every ¡contest ¡requires ¡the ¡same ¡skill, ¡or ¡formally, ¡ ¡
  • In ¡this ¡case ¡the ¡symmetric ¡equilibrium ¡is ¡unique. ¡ ¡
  • Let ¡contests ¡be ¡grouped ¡into ¡K ¡classes, ¡based ¡on ¡having ¡the ¡same ¡reward ¡

– Where ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡and ¡for ¡nota#onal ¡simplicity: ¡ – For ¡any ¡subset ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡we ¡define: ¡

slide-27
SLIDE 27

Theorem ¡4.1 ¡

  • Under ¡the ¡player-­‑specific ¡skills, ¡the ¡symmetric ¡equilibrium ¡sa#sfies ¡the ¡following ¡

two ¡proper#es: ¡ 1. Threshold ¡Reward: ¡A ¡contest ¡is ¡selected ¡by ¡a ¡player ¡with ¡strictly ¡posi#ve ¡ probability ¡only ¡if ¡the ¡reward ¡offered ¡by ¡this ¡contest ¡is ¡one ¡of ¡the ¡ ¡ ¡ ¡ ¡highest ¡ ¡ rewards, ¡where ¡

– Intui#on: ¡ ¡At ¡a ¡certain ¡point, ¡contests ¡with ¡low ¡rewards ¡will ¡get ¡no ¡par#cipants. ¡ ¡

2. Par#cipa#on ¡rates: ¡A ¡player ¡selects ¡a ¡par#cular ¡contest ¡of ¡class ¡ ¡ ¡ ¡ ¡with ¡probability ¡ ¡ ¡ ¡ ¡ ¡ ¡ given ¡by ¡ ¡ ¡

slide-28
SLIDE 28

Theorem ¡4.2 ¡

Players ¡have ¡a ¡minimum ¡reward ¡level ¡and ¡compete ¡in ¡contests ¡at ¡or ¡above ¡this ¡ level ¡with ¡decreasing ¡probability. ¡The ¡minimum ¡reward ¡level ¡increases ¡with ¡skill ¡

  • level. ¡Overall, ¡contests ¡with ¡higher ¡rewards ¡get ¡more ¡players. ¡ ¡
slide-29
SLIDE 29
slide-30
SLIDE 30

Contest-­‑Specific ¡Skills ¡

  • A ¡player’s ¡skills ¡for ¡each ¡contest ¡are ¡drawn ¡

independently ¡

  • A ¡player ¡will ¡only ¡need ¡to ¡pay ¡aCen#on ¡to ¡his ¡

highest ¡skill ¡in ¡each ¡reward ¡class ¡

slide-31
SLIDE 31

Extensions ¡

  • Asymmetric ¡Skills ¡ ¡

– Suppose ¡the ¡maximum ¡skill ¡m ¡is ¡specific ¡to ¡each ¡ contest ¡class ¡ – Can ¡we ¡infer ¡these ¡maximal ¡skill ¡levels ¡by ¡ examining ¡par#cipa#on ¡levels? ¡(ie. ¡Make ¡it ¡ endogenous) ¡

  • Minimum ¡Effort ¡

– Corresponds ¡to ¡having ¡a ¡minimum ¡bid, ¡or ¡entry ¡ fee ¡

slide-32
SLIDE 32

System ¡Design ¡

  • Maximize ¡overall ¡social ¡welfare ¡
  • There ¡is ¡u#lity ¡gained ¡with ¡a ¡greater ¡number ¡
  • f ¡par#cipants ¡in ¡a ¡contest. ¡ ¡
  • There ¡is ¡a ¡cost ¡associated ¡with ¡the ¡rewards ¡

that ¡are ¡paid ¡

  • In ¡a ¡zero-­‑cost ¡setng, ¡op#mal ¡rewards ¡are ¡

unique ¡up ¡to ¡a ¡mul#plica#ve ¡constant ¡

slide-33
SLIDE 33

All-­‑Pay ¡Auc#ons ¡Empirical ¡Results ¡(taskcn.com) ¡

slide-34
SLIDE 34
  • Tasks ¡on ¡the ¡Chinese ¡web ¡site ¡Taskcn ¡
  • Tasks ¡with ¡a ¡single ¡winner ¡in ¡the ¡year ¡2008 ¡
  • Graphics, ¡Characters, ¡and ¡Miscellaneous ¡categories ¡
  • Par#cular ¡focus ¡on ¡Graphics ¡category ¡including: ¡

– Logos ¡subcategory ¡ – 2-­‑D ¡design ¡subcategory ¡ – Conjecture: ¡these ¡subcategories ¡use ¡homogeneous ¡skills ¡

Comparing ¡Empirical ¡Analysis ¡to ¡Analy#cal ¡Predic#ons ¡

slide-35
SLIDE 35

Heterogeneity ¡of ¡tasks? ¡ Sort ¡of ¡logarithmic ¡

slide-36
SLIDE 36
slide-37
SLIDE 37

1,431 ¡tasks ¡had ¡774 ¡dis#nct ¡winners—however, ¡a ¡ group ¡of ¡122 ¡users ¡accounted ¡for ¡50% ¡of ¡all ¡winning ¡ submissions ¡

slide-38
SLIDE 38
slide-39
SLIDE 39

Summary ¡

  • Players ¡randomize ¡dependent ¡on ¡the ¡skill ¡level ¡

they ¡get ¡

  • Contests ¡with ¡rewards ¡below ¡a ¡certain ¡threshold ¡

get ¡no ¡par#cipants ¡

  • Players ¡in ¡certain ¡intervals ¡of ¡skills ¡have ¡a ¡certain ¡

interval ¡of ¡contests ¡they ¡par#cipate ¡in ¡

– As ¡skills ¡increase, ¡they ¡only ¡par#cipate ¡in ¡the ¡highest ¡ paying ¡contest ¡

  • Logarithmic ¡rela#onship ¡between ¡rewards ¡and ¡

par#cipa#on ¡(in ¡large ¡systems) ¡

slide-40
SLIDE 40

Further ¡Ques#ons ¡

  • Why ¡can ¡players ¡only ¡pick ¡one ¡contest? ¡

– Not ¡the ¡case ¡since ¡122 ¡players ¡won ¡over ¡50% ¡of ¡1431 ¡contests ¡

  • What ¡if ¡we ¡had ¡mul#ple ¡winners? ¡
  • How ¡can ¡we ¡capture ¡the ¡“#me-­‑element” ¡of ¡these ¡

situa#ons? ¡

  • What ¡if ¡the ¡market ¡becomes ¡so ¡big ¡that ¡it ¡becomes ¡

difficult ¡to ¡search ¡for ¡tasks? ¡

  • Why ¡is ¡there ¡ ¡a ¡drop-­‑off ¡in ¡par#cipa#on ¡for ¡contests ¡with ¡

high ¡rewards? ¡

  • What ¡may ¡be ¡other ¡highly ¡influen#al ¡externali#es? ¡
  • Differences ¡between ¡money ¡and ¡reputa#on? ¡
slide-41
SLIDE 41
slide-42
SLIDE 42
slide-43
SLIDE 43
slide-44
SLIDE 44
slide-45
SLIDE 45