Simultaneous Transla/on for Hiero Simon Fraser University - - PowerPoint PPT Presentation

simultaneous transla on for hiero
SMART_READER_LITE
LIVE PREVIEW

Simultaneous Transla/on for Hiero Simon Fraser University - - PowerPoint PPT Presentation

Simultaneous Transla/on for Hiero Simon Fraser University Maryam Siahbani, Anoop Sarkar Hierarchical Phrase-based Transla/on (Hiero) Synchronous Context-Free Grammar


slide-1
SLIDE 1

Simultaneous ¡Transla/on ¡for ¡Hiero ¡

¡

Simon ¡Fraser ¡University ¡

Maryam ¡Siahbani, ¡Anoop ¡Sarkar ¡

slide-2
SLIDE 2

Phrase ¡pairs ¡ Decoder ¡

Hierarchical ¡Phrase-­‑based ¡Transla/on ¡ ¡

Synchronous Context-Free Grammar

2 ¡

Align ¡Words ¡

En ¡

Zh ¡

SCFG ¡ Output ¡ transla5on ¡

X ¡-­‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<事情 ¡/ ¡what ¡> ¡ 我们 十分 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡ 地区 ¡ 非洲 ¡

Find ¡the ¡correct ¡transla/on ¡ for ¡new ¡input ¡

(Hiero) ¡

X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ we ¡are ¡very ¡much ¡ ¡ X-­‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ concerned ¡with ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡happens ¡in ¡ what ¡ African ¡regions ¡ X ¡-­‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X-­‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ X ¡-­‑> ¡ ¡<事情 ¡/ ¡what ¡> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡

slide-3
SLIDE 3

Hiero ¡Decoder ¡(CKY) ¡

O(n^3) ¡ Language ¡Model ¡(LM) ¡ computa>on ¡

3 ¡

我们 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡ 。 ¡

we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡African ¡regions ¡. ¡

X_2 ¡ X_1 ¡

X_2= ¡what ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ X ¡-­‑> ¡ ¡<关注 X_1 ¡发生 的 X_2 ¡/ ¡concerned ¡with ¡X_2 ¡happens ¡in ¡X_1> ¡ X_1= ¡African ¡regions ¡ concerned ¡with ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡happens ¡in ¡ what ¡ ¡African ¡regions ¡

LM ¡ LM ¡ LM ¡

BoEom-­‑up ¡parsing ¡ algorithm ¡

we ¡are ¡very ¡much ¡concerned ¡with ¡

slide-4
SLIDE 4

African ¡regions ¡ ¡

的 ¡

LeU-­‑to-­‑Right ¡Decoding ¡

X ¡-­‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ <s> ¡[0,8] ¡ <s> ¡ ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡

我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡

X ¡-­‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-­‑> ¡ ¡<的 ¡/ ¡in ¡> ¡

O(n^2) ¡ Fewer ¡LM ¡calls ¡

we ¡are ¡very ¡much ¡ [2,8] ¡ concerned ¡with ¡ [3,8] ¡ what ¡happens ¡ [6,7] ¡[3,5] ¡ in ¡ [3,5] ¡

4 ¡

LM ¡ LM ¡

slide-5
SLIDE 5

LR-­‑Hiero ¡

5 ¡

Hiero ¡(CKY) ¡

(Chiang ¡ACL’05) ¡

LR ¡target ¡genera/on ¡

(Watanabe ¡et ¡al., ¡ ACL’06) ¡

LR-­‑Hiero ¡ Augmented ¡LR-­‑Decoding ¡

(Siahbani ¡et ¡al., ¡EMNLP’13) ¡

Improve ¡LR-­‑Hiero ¡

(Siahbani ¡&Sarkar ¡EMNLP’14) ¡ (Siahbani ¡& ¡Sarkar ¡AMTA’14) ¡ (Siahbani ¡et ¡al ¡SLT’14) ¡

slide-6
SLIDE 6

Hiero ¡vs ¡LR-­‑Hiero ¡

17 ¡ 19 ¡ 21 ¡ 23 ¡ 25 ¡ 27 ¡ 29 ¡ 0 ¡ 2000 ¡ 4000 ¡ 6000 ¡ 8000 ¡ BLEU ¡ LM ¡Calls ¡ Czech-­‑English ¡ German-­‑English ¡ Chinese-­‑English ¡

LR-­‑Hiero ¡ Hiero ¡

6 ¡

slide-7
SLIDE 7

Greibach ¡Normal ¡Form ¡

7 ¡

X ¡-­‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ X ¡-­‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-­‑> ¡ ¡<的 ¡/ ¡in ¡> ¡

GNF ¡

X ¡-­‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡

Non-­‑GNF ¡

slide-8
SLIDE 8

Simultaneous ¡ Transla>on ¡

slide-9
SLIDE 9

hgp://site.interpretereduca/ononline.com/interpre/ng-­‑jokes/ ¡

slide-10
SLIDE 10

的 ¡

Simultaneous ¡Decoding ¡

<s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡

我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡

10 ¡

X ¡-­‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡

?? ¡ ?? ¡

slide-11
SLIDE 11

Wait ¡/ll ¡the ¡end ¡… ¡ Translate ¡incrementally ¡… ¡ (higher ¡fluency ¡and ¡latency) ¡ (lower ¡fluency ¡and ¡latency) ¡

slide-12
SLIDE 12

Do ¡not ¡segment ¡when ¡reordering ¡ is ¡required ¡

slide-13
SLIDE 13

Sentence ¡Segmenta/on ¡

13 ¡

(Matusov ¡IWSLT’06) ¡ (Fügen ¡et ¡al., ¡MT’07) ¡ (Bangalore ¡et ¡al., ¡ NAACL’12) ¡ (Fujita ¡et ¡al ¡ InterSpeech’13) ¡ (Yarmohammadi ¡et ¡al ¡IJCNLP’13) ¡ (Oda ¡et ¡al ¡ACL’14) ¡ (Grissom ¡et ¡al ¡ EMNLP ¡’14) ¡ (Mieno ¡et ¡al ¡InterSpeech’15) ¡ Prehistory: ¡ Batch ¡and ¡Monotone ¡ ¡ (Tillmann ¡et ¡al., ¡ACL’1997) ¡ (Pytlik ¡and ¡Yarowsky, ¡AMTA’06) ¡

slide-14
SLIDE 14

Simultaneous ¡ Transla>on ¡ using ¡GNF ¡SCFGs ¡

(Siahbani ¡et ¡al, ¡SLT ¡2014) ¡

slide-15
SLIDE 15

Hiero ¡decoding ¡made ¡ possible ¡using ¡LR-­‑Hiero ¡

slide-16
SLIDE 16

Train ¡the ¡Segmenter ¡

  • Produce ¡word ¡alignment ¡for ¡training ¡data ¡

(GIZA++) ¡

  • Find ¡all ¡monotone ¡phrase ¡pair ¡boundaries ¡
  • Make ¡sure ¡phrase ¡pairs ¡are ¡long ¡enough ¡

(phrases ¡of ¡length ¡3 ¡or ¡more) ¡

  • Find ¡a ¡suitable ¡set ¡of ¡features ¡to ¡classify ¡

segment ¡boundaries ¡

  • Train ¡a ¡classifier ¡to ¡recognize ¡segment ¡

boundaries ¡

slide-17
SLIDE 17

Datasets ¡

  • Train ¡the ¡segmenter: ¡

– IWSLT ¡2011 ¡shared ¡task: ¡English-­‑French ¡TED ¡talks ¡

  • Train ¡the ¡transla/on ¡model: ¡

– EuroParl ¡v7 ¡plus ¡IWSLT ¡2011 ¡shared ¡task ¡data ¡

  • Train ¡the ¡language ¡model: ¡

– WMT ¡2011 ¡French ¡data ¡(EuroParl, ¡News ¡ Commentary, ¡UN) ¡

  • Tuning ¡set ¡and ¡Test ¡set ¡

– IWSLT ¡2010 ¡shared ¡task ¡data ¡(dev2010, ¡tst2010) ¡

slide-18
SLIDE 18

Features ¡for ¡segmenter ¡ ¡

  • Basic ¡

– Word ¡at ¡segment ¡ boundary ¡(punct, ¡conj) ¡ – Posi/on ¡of ¡boundary ¡ – Length ¡of ¡segment ¡

  • Part ¡of ¡speech ¡

– Trigram ¡before ¡segment ¡ – Bi/trigram ¡at ¡end ¡of ¡ segment ¡

  • Decoder ¡

– Language ¡model ¡(lm) ¡ – P(e|f) ¡phrase ¡pair ¡(tm0) ¡ – P(f|e) ¡phrase ¡pair ¡(tm1) ¡ – Lex(e|f) ¡lexical ¡(tm3) ¡ – Lex(f|e) ¡lexical ¡(tm4) ¡ – Log-­‑linear ¡model ¡score ¡ (c) ¡

  • Best ¡performing ¡

segmenter ¡F1 ¡= ¡81.6% ¡

– Basic ¡+ ¡POS ¡+ ¡(lm,tm0,c) ¡

slide-19
SLIDE 19

Results ¡

BLEU ¡ Time ¡(secs) ¡ No ¡ segmenta/on ¡ 25.72 ¡ 19.62 ¡ With ¡ segmenta/on ¡ ¡ 24.48 ¡ 0.84 ¡

slide-20
SLIDE 20

Our ¡Current ¡Work ¡

  • Pareto ¡Op/mality ¡for ¡balancing ¡speed/latency ¡

versus ¡fluency/accuracy ¡

– Take ¡reordering ¡into ¡account ¡ – Let ¡the ¡decoder ¡decide ¡ – The ¡“least ¡worst” ¡BLEU ¡score ¡for ¡different ¡ segment ¡lengths ¡may ¡result ¡in ¡varying ¡speed ¡

slide-21
SLIDE 21

Ques/ons? ¡

21 ¡

slide-22
SLIDE 22

Extra ¡Slides ¡

22 ¡

slide-23
SLIDE 23

Rule ¡ Extrac>on ¡

slide-24
SLIDE 24
  • Search ¡for ¡sub-­‑phrases ¡within ¡larger ¡ones ¡

– Smaller ¡phrases ¡are ¡replaced ¡by ¡non-­‑terminal ¡X ¡

¡

  • Es/ma/ng ¡rule ¡frequency ¡

– Uniformly ¡distribute ¡the ¡frac/onal ¡count ¡to ¡all ¡rules ¡ extracted ¡from ¡the ¡phrase-­‑pair ¡

¡ ¡

Hiero ¡Rule ¡Extrac/on ¡

24 ¡

X ¡-­‑> ¡ ¡<我们十分X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡

happens ¡ 发生 ¡ 事情 ¡ 我们十分 ¡ 关注 ¡ 的 ¡ we ¡are ¡very ¡much ¡ concerned ¡with ¡ what ¡ in ¡ region ¡ 地区 ¡ 非洲 ¡ African ¡

X_1 ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡X_1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ X_1 ¡ X_2 ¡ X_2 ¡ X_1 ¡

Constraints: ¡

Length ¡of ¡phrase-­‑pairs ¡(usually ¡10) ¡ At ¡most ¡2 ¡non-­‑terminals ¡ Non-­‑adjacent ¡non-­‑terminals ¡on ¡the ¡source ¡side ¡ X ¡-­‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡ X ¡-­‑> ¡ ¡<X_1 ¡的 ¡X_2 ¡/ ¡X_2 ¡X_1 ¡in> ¡ X ¡-­‑> ¡ ¡<X_1 ¡事情 ¡/ ¡what ¡X_1> ¡ X ¡-­‑> ¡ ¡<发生 的 ¡X_1 ¡/ ¡X_1 ¡happens ¡in> ¡ X ¡-­‑> ¡ ¡<发生 的 事情 ¡/ ¡what ¡happens ¡in> ¡

happens ¡ 发生 ¡ 事情 ¡ 的 ¡ what ¡ in ¡

1 ¡ 0.25 ¡ 0.25 ¡ 0.25 ¡ 0.25 ¡

¡ ¡ ¡ ¡ LR-­‑Hiero: ¡filtering ¡non-­‑GNF ¡rules ¡ ¡ ¡ ¡ ¡

slide-25
SLIDE 25

Hiero ¡Rule ¡Extrac/on: ¡Issues ¡

  • Unable ¡to ¡capture ¡all ¡alignments ¡

¡

  • Allowing ¡more ¡non-­‑terminals ¡in ¡rules ¡is ¡not ¡prac/cal ¡in ¡

CKY ¡decoders ¡

  • Relax ¡constraints ¡(ini/al ¡phrase ¡length ¡& ¡number ¡of ¡

non-­‑terminals) ¡ ¡

– increases ¡the ¡/me ¡complexity ¡of ¡rule ¡extrac/on ¡ ¡

zhe ¡ hui ¡ zhōngguo ¡hé ¡èluósī ¡ de ¡ guānxi ¡ fāzhǎn ¡ 。 ¡

This ¡ will ¡produce ¡

  • n ¡

the ¡development ¡ China ¡and ¡Russia ¡ ¡ rela/ons ¡ .

dui ¡

any ¡effect ¡

hui ¡chǎnshēng ¡ shenme ¡yǐngxiǎng ¡

  • f ¡

X_1 ¡ X_2 ¡ X_3 ¡

25 ¡

LR-­‑Decoding ¡ ¡ ¡O(n^2) ¡

slide-26
SLIDE 26

26 ¡

New ¡GNF ¡Rule ¡Extrac/on ¡

Largest ¡Right ¡Sub-­‑phrase ¡(LRS) ¡

  • ­‑ ¡the ¡longest ¡phrase ¡pair ¡(in ¡terms ¡of ¡length ¡
  • f ¡target ¡side) ¡which ¡share ¡the ¡same ¡target ¡

right ¡boundary ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡

ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡

2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡

gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡

2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡

ihre ¡ arbeit ¡ gemacht ¡ not ¡ yet ¡ their ¡ nicht ¡ noch ¡ work ¡ done ¡

LRS(2,5) ¡= ¡[4,5] ¡ LRS(2,7) ¡= ¡[5,7] ¡ LRS(5,7) ¡= ¡[6,7] ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ (1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(6,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡

O(m^2) ¡

X-­‑> ¡< ¡SOURCE ¡/ ¡a ¡b ¡X_1 ¡…X_n> ¡

phrase ¡pairs ¡are ¡iden/fied ¡to ¡their ¡target ¡spans ¡

slide-27
SLIDE 27

27 ¡

New ¡GNF ¡Rule ¡Extrac/on ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ 0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡

ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡

(1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡ 2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡

not ¡ yet ¡ nicht ¡ noch ¡ [2,4] ¡ [5,7] ¡

(3,4) ¡ 5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡

ihre ¡ arbeit ¡ their ¡ work ¡

(6,7) ¡

[3,4] ¡ X-­‑> ¡<noch ¡/ ¡yet> ¡ X-­‑> ¡<X_1 ¡nicht/not ¡X_1> ¡ X-­‑> ¡<noch ¡nicht/not ¡yet> ¡ X-­‑> ¡<ihre ¡arbeit/their ¡work> ¡ X-­‑> ¡<ihre ¡X_1/their ¡X_1> ¡ [6,7] ¡ X-­‑> ¡<arbeit ¡/ ¡work> ¡

2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡

gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡ [4,5] ¡ X-­‑> ¡<gemacht ¡/ ¡done> ¡ [2,5] ¡ X-­‑> ¡<noch ¡nicht ¡gemacht/not ¡yet ¡done> ¡ X-­‑> ¡<noch ¡nicht ¡X_1/not ¡yet ¡X_1> ¡ X-­‑> ¡<X_1 ¡nicht ¡X_2/not ¡X_1 ¡X_2> ¡ X-­‑> ¡<X_1 ¡X_2/ ¡X_1 ¡X_2> ¡ X-­‑> ¡<noch ¡nicht ¡X_1/not ¡yet ¡X_1> ¡

LRS ¡ X ¡ X ¡ X ¡ X ¡

slide-28
SLIDE 28

new ¡

  • ld ¡

⌐old ¡ ⌐new ¡

100.9 ¡M ¡ 89.0 ¡M ¡ 0 ¡

  • thers ¡

Zh-­‑En ¡

Experiments ¡

SCFG ¡& ¡ ¡old ¡GNF: ¡ ¡ini/al ¡phrase ¡length ¡10, ¡maximum ¡source ¡length ¡ ¡7, ¡ ¡2 ¡non-­‑terminals ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡ Model ¡size ¡(million) ¡ SCFG ¡

  • ld ¡GNF ¡

GNF-­‑4 ¡

28 ¡

GNF-­‑4: ¡ ¡all ¡phrase ¡pairs, ¡maximum ¡source ¡length ¡ ¡10, ¡ ¡4 ¡non-­‑terminal ¡ new ¡

  • ld ¡

⌐old ¡ ⌐new ¡

116.0 ¡M ¡ 98.8 ¡M ¡ 0 ¡

  • thers ¡

De-­‑En ¡

new ¡

  • ld ¡

⌐old ¡ ⌐new ¡

306.3 ¡M ¡ 74.6 ¡M ¡ 0 ¡

  • thers ¡

Cs-­‑En ¡

Kriya ¡

slide-29
SLIDE 29

Results ¡(LM ¡calls) ¡

0 ¡ 1000 ¡ 2000 ¡ 3000 ¡ 4000 ¡ 5000 ¡ 6000 ¡ 7000 ¡ 8000 ¡ Average ¡# ¡LM ¡calls ¡

  • ld ¡GNF ¡

GNF-­‑1 ¡ GNF-­‑2 ¡ GNF-­‑3 ¡ GNF-­‑4 ¡ Average ¡number ¡of ¡language ¡model ¡calls ¡on ¡sample ¡set ¡of ¡50 ¡sentences ¡ from ¡ ¡testset. ¡ GNF-­‑x ¡(new ¡GNF ¡rules): ¡ ¡x ¡non-­‑terminal ¡ ¡

29 ¡

slide-30
SLIDE 30

Results ¡(BLEU) ¡

  • ld ¡GNF: ¡ ¡maximum ¡source ¡length ¡ ¡7, ¡ ¡2 ¡non-­‑terminals ¡

GNF-­‑x ¡(new ¡GNF ¡rules): ¡maximum ¡source ¡length ¡ ¡10, ¡ ¡x ¡non-­‑terminal ¡

30 ¡

19 ¡ 20 ¡ 21 ¡ 22 ¡ 23 ¡ 24 ¡ 25 ¡ 26 ¡ 27 ¡

Czech-­‑English ¡ German-­‑English ¡ Chinese-­‑English ¡

BLEU ¡

  • ld ¡GNF ¡

GNF-­‑1 ¡ GNF-­‑2 ¡ GNF-­‑3 ¡ GNF-­‑4 ¡

0.27 ¡

slide-31
SLIDE 31

Alignment ¡Coverage ¡

Model ¡

Czech-­‑English ¡ German-­‑English ¡ Chinese-­‑English ¡

SCFG ¡ 318 ¡ 351 ¡ 187 ¡

  • ld ¡GNF ¡

278 ¡ 300 ¡ 132 ¡ GNF-­‑4 ¡ 306 ¡ 375 ¡ 163 ¡

Number ¡of ¡sentences ¡(devset) ¡covered ¡in ¡forced ¡decoding ¡mode ¡

slide-32
SLIDE 32

Conclusion ¡and ¡Future ¡Direc/ons ¡

  • A ¡new ¡algorithm ¡for ¡GNF ¡rule ¡extrac/on ¡
  • Sentence ¡level ¡GNF ¡rules ¡in ¡LR-­‑Hiero: ¡

– ¡Improve ¡alignment ¡coverage ¡ ¡ – Marginally ¡affects ¡decoding ¡speed ¡

  • Rules ¡with ¡more ¡non-­‑terminals ¡are ¡less ¡

frequent ¡

  • Elaborate ¡features ¡for ¡rules ¡with ¡more ¡than ¡2 ¡

non-­‑terminals ¡

32 ¡

slide-33
SLIDE 33

Ques/ons? ¡

33 ¡

slide-34
SLIDE 34

Experiments ¡

  • 3 ¡language ¡pairs: ¡

– ¡Cs-­‑En, ¡De-­‑En, ¡Zh-­‑En ¡

Corpus ¡(train;dev;test) ¡ Cs-­‑En ¡ Europarl(v7)+CzEng(v0.9); ¡News ¡commentary(nc) ¡ 2008&2009; ¡nc ¡2011 ¡ 7.95M/3k/3k ¡ De-­‑En ¡ Europarl(v7); ¡WMT2006; ¡WMT2006 ¡ 1.5M/2k/2k ¡ Zh-­‑En ¡

HK ¡parallel-­‑tex+GALE ¡ph-­‑1; ¡MTC ¡parts ¡1&3; ¡MTC ¡part ¡4 ¡

2.3M/1928/919 ¡

34 ¡

slide-35
SLIDE 35

Experiments ¡

  • Hiero ¡rule ¡extrac/on; ¡Kriya ¡(Sankaran ¡et ¡al., ¡2012) ¡

– SCFG ¡ – GNF ¡

  • Configura/on ¡and ¡seˆngs: ¡ ¡

– Maximum ¡2 ¡non-­‑terminals ¡ – maximum ¡source ¡length ¡7 ¡ ¡ – ini/al ¡phrase ¡length ¡10 ¡

  • New ¡GNF ¡extrac/on: ¡

– Maximum ¡4 ¡non-­‑terminals ¡ – Maximum ¡source ¡length ¡10 ¡ – All ¡phrase ¡pairs ¡(including ¡sentence ¡level) ¡

35 ¡

slide-36
SLIDE 36

的 ¡

LeU-­‑to-­‑Right ¡Decoding ¡

X ¡-­‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ <s> ¡[0,8] ¡ <s> ¡ ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡ <s> ¡ ¡we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ ¡

我们 ¡ 关注 ¡ 发生 ¡ 事情 ¡ 地区 ¡ 十分 ¡ 非洲 ¡

X ¡-­‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-­‑> ¡ ¡<的 ¡/ ¡in ¡> ¡

O(n^2) ¡ Fewer ¡LM ¡calls ¡

we ¡are ¡very ¡much ¡ [2,8] ¡ concerned ¡with ¡ [3,8] ¡ what ¡happens ¡ [6,7] ¡[3,5] ¡ in ¡ [3,5] ¡ African ¡ regions ¡ ¡

36 ¡

LM ¡ LM ¡

X ¡-­‑> ¡ ¡<我们十分 X_1 ¡/ ¡we ¡are ¡very ¡much ¡X_1> ¡ X ¡-­‑> ¡ ¡<X_1 ¡发生 X_2事情 ¡/ ¡what ¡happens ¡X_2 ¡X_1> ¡ X ¡-­‑> ¡ ¡<非洲 地区 ¡/ ¡African ¡regions ¡> ¡ X ¡-­‑> ¡ ¡< ¡关注 X_1 ¡/ ¡concerned ¡with ¡X_1> ¡ X ¡-­‑> ¡ ¡<的 ¡/ ¡in ¡> ¡

GNF ¡

X ¡-­‑> ¡ ¡<X_1 ¡发生 的 ¡X_2 ¡/ ¡X_2 ¡happens ¡in ¡X_1> ¡

Non-­‑GNF ¡

slide-37
SLIDE 37

37 ¡

New ¡GNF ¡Rule ¡Extrac/on ¡

Largest ¡Right ¡Sub-­‑phrase ¡(LRS) ¡

  • ­‑ ¡the ¡largest ¡phrase ¡pair ¡(in ¡terms ¡of ¡length ¡
  • f ¡target ¡side) ¡which ¡share ¡the ¡same ¡target ¡

right ¡boundary ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡8 ¡

ihre ¡ arbeit ¡ gemacht ¡ haben ¡ students ¡ not ¡ yet ¡ their ¡ . ¡ nicht ¡ noch ¡ work ¡ done ¡ schuler ¡ have ¡ . ¡

2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡

gemacht ¡ not ¡ yet ¡ nicht ¡ noch ¡ done ¡

2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡

ihre ¡ arbeit ¡ gemacht ¡ not ¡ yet ¡ their ¡ nicht ¡ noch ¡ work ¡ done ¡

LRS(2,5) ¡= ¡[4,5] ¡ LRS(2,7) ¡= ¡[5,7] ¡ LRS(5,7) ¡= ¡[6,7] ¡

0 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡7 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡

Sub-­‑problem ¡

(1,2) ¡ ¡ ¡ ¡ ¡ ¡(2,3) ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(6,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,3) ¡ ¡ ¡ ¡ ¡ ¡(3,4) ¡ ¡ ¡ ¡ ¡(4,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (2,4) ¡ ¡ ¡ ¡ ¡ ¡(2,5) ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (2,5) ¡ ¡ ¡ ¡ ¡ ¡(5,6) ¡ ¡ ¡ ¡ ¡(5,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (5,6) ¡ ¡ ¡ ¡ ¡ ¡(2,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ (1,7) ¡ ¡ ¡ ¡ ¡ ¡(7,8) ¡ ¡ (1,8) ¡

O(m^2) ¡

slide-38
SLIDE 38

Distor/on ¡Feature ¡

38 ¡

slide-39
SLIDE 39

Reordering ¡feature ¡

  • Number ¡of ¡reordering ¡rules ¡(non-­‑terminals ¡on ¡source ¡

and ¡target ¡side ¡are ¡reordered) ¡

39 ¡

slide-40
SLIDE 40

LR-­‑Decoding ¡with ¡Beam ¡Search ¡

  • Stacks: ¡hypotheses ¡with ¡same ¡number ¡of ¡source ¡side ¡

words ¡covered ¡

  • Exhaus/vely ¡genera/ng ¡all ¡possible ¡par/al ¡

hypotheses ¡for ¡a ¡given ¡stack ¡

40 ¡

slide-41
SLIDE 41

Cube ¡pruning ¡

  • each ¡cube: ¡a ¡grouped ¡of ¡hypotheses ¡and ¡applicable ¡

rules ¡ ¡

  • Cubes ¡are ¡fed ¡to ¡a ¡priority ¡queue ¡which ¡fills ¡the ¡

current ¡stack ¡

41 ¡

slide-42
SLIDE 42

Cube ¡pruning ¡

42 ¡

slide-43
SLIDE 43

Time ¡efficiency: ¡avg ¡of ¡LM ¡queries ¡

43 ¡

slide-44
SLIDE 44

Transla/on ¡quality ¡

44 ¡

slide-45
SLIDE 45

CKY ¡decoding ¡

. O(n3) ¡ LM ¡computa>on ¡

45 ¡

我们 ¡ 关注 ¡ 发生 ¡ 的 ¡ 事情 ¡

we ¡are ¡very ¡much ¡ with ¡ ¡ what ¡ in ¡ region ¡

地区 ¡ 十分 ¡ 非洲 ¡

African ¡ happens ¡

。 ¡

concerned ¡ we ¡are ¡very ¡much ¡concerned ¡with ¡what ¡happens ¡in ¡African ¡regionss ¡. ¡ O(n3b) ¡

slide-46
SLIDE 46

Tā ¡shuō ¡, ¡ ¡ ¡zài ¡fǎngwèn ¡ ¡rìběn ¡de ¡ ¡4 ¡ ¡/ān ¡ ¡qíjiān ¡ ¡ ¡, ¡ ¡ ¡ ¡tā ¡ ¡ ¡jiāng ¡jìnxíng ¡ ¡ ¡shēnrù ¡tǎolùn ¡ ¡ ¡. ¡ ¡ he ¡said ¡, ¡ ¡ ¡he ¡ ¡will ¡conduct ¡ ¡ ¡detailed ¡discussions ¡ ¡during ¡ ¡four-­‑day ¡ ¡ ¡ ¡visit ¡ ¡ ¡in ¡japan ¡ ¡ ¡ ¡. ¡